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Verfahren zur Identifizierung biologisch aktiver Strukturen mikrobieller Erreger 

5 Die vorliegende Erfindung betriflt ein Verfahren zur Identifizierung biologisch aktiver 
Strukturen, die durch das Genom von mikrobiellen Erregern kodiert werden, ausgehend von 
genomischen Erregernukleinsauren. 

Hintergrund der Erfindung 

10 

Die Entwicklung von molekular definierten Serodiagnostika und ImpfstofFen setzt die 
molekulare Kenntnis und die Verfugbarkeit der durch das Immunsystem eines infizierten 
Wirtes erkannten Antigene des pathogenen Erregers (das mikrobielle Immunom) voraus. Die 
Serodiagnostik von Infektionskrankheiten basiert auf dem Nachweis von im Blut 

15 zirkulierenden Antikdrpern, die spezifisch gegen immunogene Bestandteile (Antigene) des 
Erregers gerichtet sind und somit eine vorhandene oder abgelaufene Infektion anzeigen. Die 
Kenntnis dieser Antigene erlaubt es, dieselben als molekular definierte Impfstoflfe 
rekombinant herzustellen. Diese Impfstoflfe konnen einem Organismus einen Schutz vor einer 
Infektion mit dem betreffenden Erreger bieten (prophylaktische Immunisierung) aber audi bei 

20 persistierenden und chronischen Erregern zu deren Eliminierung dienen (therapeutische 
Immunisierung). Die Bedeutung, die solchen Antigenen sowohl fur eine spezifische 
Diagnostik als auch fur eine spezifische Therapie zukommt, fuhrt zu einem betrachtlichen 
Interesse an der Identifikation dieser Strukturen. 

Wahrend fur niedrigkomplexe Infektionserreger mit bekanntem Genom (z.B. einfache Viren) 
25 die meisten relevanten Antigene molekular identifiziert sind, ist noch unklar, welche Antigene 
bei komplexeren Infektionserregern (z.B. Bakterien) immunologisch relevant sind. Die 
Ursache hierfur liegt darin, dass die komplexen Genome dieser Erreger eine Vielzahl von 
Genen (1000 bis uber 4000) enthalten, die eine schnelle Identifikation der relevanten 
Antigene erschweren. Selbst bei Erregern, deren Genome vollstandig bekannt sind, muss man 
30 davon ausgehen, dass die Zuordnung aller Nukleotidbereiche zu tatsachlich fur Proteine 
kodierenden -und somit potentiell Antigene ergebenden Abschnitten- noch nicht vollstandig 
erfolgt ist. 

Eine Reihe von Techniken, die zur Identifikation von Antigenen in den letzten Jahren 
entwickelt wurden, versuchen dieser Komplexitat gerecht zu werden. Die meisten dieser 
35 Verfahren stammen aus dem Feld der „Proteomics"-Technologien, welche Hochdurchsatz- 
Technologien der Proteinanalyse bezeichnet. 
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Eine dieser Hochdurchsatz-Technologien umfasst die Verwendung von 2-D-Gelen (z.B. 
Liu B, Marks JD. (2000), Anal Biochem. 286,1191-28). Da bei diesem Verfahren grofie 
Mengen von Erregern benotigt werden, werden diese zunachst unter Kulturbedingungen 
angeziichtet. Danach werden Extrakte aus lysierten Erregern hergestellt und die darin 
5 befindlichen Proteine per Gelelektrophorese aufgetrennt. Durch Immunseren (Patientenseren, 
Seren immunisierter Tiere) erkannte Proteinkomplexe kdnnen durch Isolierung und 
Mikrosequenzierung analysiert werden. Dieses Verfahren weist eine Reihe von Limitationen 
und Nachteilen auf, da fur die Untersuchungen grofle Mengen von Erregermaterial notwendig 
sind. Eine Analyse direkt aus der Primarl&sion ist nicht mdglich, sondern erst nach z.T. sehr 
10 langwieriger Kultur (z.B. bei Mykobakterien). Einige Erreger sind nicht einfach anzuzuchten, 
fur unbekannte Erreger sind Kulturbedingungen oft nicht etabliert. Tote Erreger entziehen 
sich von vorneherein diesem Anreicherungsverfahren. 

Ein weiterer Nachteil der 2-D-Gel-Technologie besteht darin, das sich der 
Genexpressionstatus eines Erregers in Zellkultur deutlich von dem in vivo unterscheidet. 

15 Viele pathogene Genprodukte werden erst bei der Invasion des Erregers in den 
Wirtsorganismus eingeschaltet. Damit stehen fur die Untersuchung lediglich solche Proteine 
zur Verfugung, die im Infektionserreger zum Zeitpunkt der Kultur exprimiert werden. Damit 
wird eine Reihe von Proteinen, die nur im Wirt unter Infektionsbedingungen in detektierbarer 
Menge exprimiert werden, von der Untersuchung ausgeschlossen. Gerade solche kdnnen 

20 jedoch fur eine diagnostische Serologie, die eine klinisch nicht relevante Kolonialisierung von 
einer invasiven Infektion unterscheiden kdnnen muss, relevant sein. 

Weiterhin werden mittels 2-D-Gelen Antigene als Proteine identifiziert. Die 
Nukleotidsequenz, die Grundlage fur viele nachfolgende Analysen ist, muss erst noch 
ermittelt werden. 

25 Als Alternative zum 2-D-Gel- Verfahren konnen bei Erregern, deren gesamte 
Nukleotidsequenz bekannt ist, alle putatitiven Gene in Expressionskassetten eingefuhrt, 
rekombinant exprimiert und auf Immunogenitat oder Antigenitat untersucht werden (Pizza et 
al. (2000), Science 287(5459): 1816-20). Die rekombinant exprimierten Gene werden z.B. in 
einem parallelisierten Dot-Blot Verfahren mit Immunseren gescreent. 

30 Die Nachteile dieses Verfahrens bestehen darin, dass lediglich Proteine, von denen bekannt 
ist, dass sie im interessierenden Erreger exprimiert werden, der Analyse zuganglich sind. 
Erreger mit unbekannter Nukleotidsequenz entziehen sich dieser Analyse. 

Da die oben genannten Untersuchungstechnologien material-, zeit-, personal- und 
kostenaufwendig sind, sind sie nur wenigen groBen Zentren vorbehalten. 

35 Eine effiziente und potentiell wirksame Alternative zu den „Proteomics"-Ans&tzen stellt das 
Immunoscreening genomischer Expressionsbanken (z.B. Pereboeva et al. (2000), J. Med. 
Virol. 60: 144-151) dar. Allerdings mussen auch hierfur Infektionserreger unter definierten 
Kulturbedingungen angereichert werden. Das Genom der Erreger wird anschlieBend isoliert, 
enzymatisch oder mechanisch in Fragmente geschnitten und in Expressionsvektoren kloniert. 
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Die exprimierten Fragmente konnen dann mit Seren daraufhin uberpriift werden, ob sie 
durch Seren von infizierten Organismen erkannt werden. Der Vorteil dieses Verfahrens ist, 
dass es kosteneffektiv und schnell zur Identifikation von Antigenen fiihren kann. Jedoch ist 
auch fiir dieses Verfahren aufgrund der groBen Menge an benotigten Erregernukleinsauren 
5 unumganglich, dass die Erreger durch in vitro Kultur vermehrt und anschlieDend aufgereinigt 
werden. Damit ist das Verfahren bisher auf Erreger limitiert, fiir die Kultur- und 
Aufreinigungsmodalitaten bekannt und etabliert sind. 

Ein Problem ist die Identifikation von bis dato nicht oder nur unzureichend charakterisierten 
Infektionserregern. Insbesondere [SHI] beschaftigt sich die vorliegende Erfindung mit den 
10 folgenden Aufgabenstellungen: 

1) Entzundliche Erkrankungen mit aufgrund von Epidemiologic und klinischem Verlauf als 
wahrscheinlich anzunehmender infektidser Ursache fur die bisher mit bekannten Verfahren 
Erreger nicht definiert bzw. nur unzureichend charakterisiert werden konnen. Hienzu zahlen 

15 Erkrankungen wie Multiple Sklerose, Kawasaki-Disease, Sarkoidose, Diabetes mellitus, 
Morbus Whipple, Pityriasis rosea u.a. Wiinschenswert fur diese Erkrankungen ist ein 
Verfahren, welches eine systematische Analyse auf bisher unbekannte Infektionserreger von 
primaren Patientenmaterial z.B. Lymphknoten-Biopsien erlaubt. 

2) Newly emerging infectious diseases. Hierzu zahlen Infektionskrankheiten, die durch bisher 
20 nicht bekannte (z.B. HTV in den 80er Jahren) oder nicht gut charakterisierte Krankheitserreger 

verursacht werden und aufgrund z B. Anderung der Epidemiologie plotzlich im Focus des 
klinischen Interesses stehen. Medizinisch und soziodkomisch essentiell fur diese Klasse von 
Infektionserkrankungen ist das schnell Erreger identifiziert und entsprechende Diagnostika 
und eventuell auch Impfstoffe produziert werden kdnnen. Da im allgemeinen die Etablierung 
25 der Kultivierungsbedingungen fiir nicht charakterisierte Erreger bis zu mehrere Jahre in 
Anspruch nehmen kann, ist auch in diesem Fall eine Identifikation von Erregern und 
Erregerantigenen direkt aus dem infizierten Gewebe sehr wiinschenswert, kann aber durch 
bekannte Verfahren nicht geleistet werden. 

Es besteht daher ein groOer Bedarf an einem Verfahren, welches die direkte Verwendbarkeit 
30 von Primarmaterial zur Erregeridentifikation ohne Notwendigkeit einer Erregervermehrung 
durch Kultur erlaubt. Weiterhin sollte dieses Verfahren die effiziente Entdeckung bisher 
unbekannter Krankheitserreger in Primarmaterial ermoglichen. 



35 
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Zusammenfassende Beschreibung der Erfindung 

Eine Aufgabe der vorliegenden Erfindung war es daher ein Verfahren zu entwickeln, welehes 
eine Identifikation von Erregernukleinsauren direkt aus einer limitierten Menge (z.B. SO 
mm 3 ) infizierten Patientenmaterial ermdgiicht. 

5 Die vorliegende Erfindung beschreibt ein Verfahren zur systematischen Identifikation von 
bekannten wie auch unbekannten nukleinsaurekodierten Erregern und ihren Antigenen anhand 
der von ihnen ausgelosten Immunantwort im Wirtsorganismus. 

Gegenstand der vorliegenden Erfindung ist daher ein Verfahren zur Identifizierung von 
biologisch aktiven Strukturen, die durch das Genom von mikrobiellen Erregern kodtert 
10 werden, ausgehend von genomischen Erregernukleinsauren, wobei das Verfahren die 
folgenden Schritte umfasst: Gewinnung von genomischen Erregernukleinsauren aus 
erregerhaltigen Proben, sequenzunabhangige Amplifikation von genomischen 
Erregernukleinsauren, Expression amplifizierter Erregernukleinsauren und Screening und 
Identifizierung der biologisch aktiven Struktur. 

15 Das erfindungsgema&e Verfahren hat den entscheidenden Vorteil, dass auch bei sehr geringer 
Erregermenge eine umfassende Identifikation vom Wirtsorganismus erkannter 
Errergerantigene (mikrobielles Immunom) moglich ist. 

Das erfindungsgemaBe Verfahren ist dadurch gekennzeichnet, dass geringste 
Ausgangsmengen bis minimal 1 pg Erregernukleinsaure ausreichen, um eine effektive 
20 Analyse zu erzielen. In einer bevorzugten Ausfuhrungsform werden 10-20 pg, insbesondere 
1 - 1 0 pg an Erregernukleinsaure verwendet. 

Die hohe Sensitivitat des Verfahrens ermdgiicht einerseits die Untersuchung von Erregern aus 
Primarisolaten ohne die Notwendigkeit, diese Erreger zuvor durch in vitro Kultur anreichern 
zu mussen. Somit konnen Erreger untersucht werden, die sich mit bekannten Methoden 
25 schwer (z.B. Mykobakterium tuberculosis u.a). oder gar nicht anziichten lassen (z.B. 
Mykobacterium leprae oder nicht-vitale Keime). 

Andererseits wird durch den Wegfall der in vitro Anreicherung vermieden, dass es zu einer 
durch die in vitro Kultur bedingten Verfalschung der Keimpopulation kommt (z.B. durch 
Uberwachsen relevanter pathogener Keime bei Mischinfektionen). 

30 Weiterhin eroffhet die hohe Sensitivitat des Verfahrens die Mdglichkeit, ein breites Spektrum 
an Ausgangsmaterialien zur Erregerisolierung zu nutzen. Der Begriff proben" bezeichnet 
dabei verschiedene biologische Materialien wie Zellen, Gewebe, Kdrperflussigkeiten. In einer 
bevorzugten Ausfuhrungsform der Erfindung stelien Blut, Gewebe, kultivierte Zellen, Serum, 
Sekret aus Lasionen (Pusteln, Krusten etc.) und andere Korperflussigkeiten wie z.B. Urin, 

35 Speichel, Liquor, Gelenkflussigkeiten, Galle und Augendrusensekrete bevorzugt verwendete 
Proben dar. 
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Detaillierte Beschreibung der Erfindung 
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Gewinnung von genomischen Erregernukleinsauren aus erregerhaltigen Proben 

Im ersten Schritt des erfindungsgemafien Verfahrens werden genomische 
5 Erregernukleinsauren aus erregerhaltigen Proben gewonnen. 

Der hier verwendete Begriff „mikrobieller Erregei" umfasst virale und bakterielle Erreger. 
Erreger liegen in Wirtszellen oder im Zellverband mit Wirtszellen vor und mussen mit 
Ausnahme von frei im Serum zirkulierenden Erregern zuganglich gemacht werden. In einer 
bevorzugten Ausfiihrungsform der Erfindung liegt der Erreger intrazeUuIfir oder extrazellulSr 
10 vor. 

Intrazellulare Erreger kdnnen durch Zellyse (z.B. mechanisch oder iiber Detergenzien, bei 
eukaryontischen Zellmembranen z.B. mittels SDS) freigesetzt werden. Bevorzugte SDS- 
Konzentration sind fur gram positive Bakterien >0,05% bis 1% und fur gramnegative 
Bakterien 0,05% bis 0,1%. Der Fachmann kann die geeignete Konzentration fur andere 
15 Detergenzien leicht bestimmen, indem die Konzentration eingesetzt wird bei der die Hulle, 
z.B die Bakterienwand des grampositiven oder des gramnegativen Bakteriums noch intakt ist, 
die eukaryontische Zellwand aber bereits aufgelost wird. 

Extrazellulare Erreger konnen z.B. iiber ihre deutlich geringere Partikelgrdfle (20 nm-1 \iM) 
von Wirtszellen getrennt werden (z.B. durch Sedimentation/Zentrifugation und/oder 
20 Filtration). 

In einer besonders bevorzugten Ausfiihrungsform der Erfindung ist der Erreger nicht-infektids 
und/oder nicht-vital. Die hohe Sensitivitat des Verfahrens ermoglicht es, dass auch auf nicht- 
infektiose und/oder nach Ablauf einer floriden Infektion auf residual verbliebene nicht-vitale 
Erreger zuriickgegriffen werden kann. 

25 Im folgenden wird der erste Schritt des erfindungsgemafien Verfahrens, die Gewinnung 
genomische Erregernukleinsauren aus erregerhaltigen Proben weiter beschrieben. 

Die Gewinnung genomischer Erregernukleinsauren aus erregerhaltigen Proben ist in einer 
bevorzugten Ausfiihrungsform der Erfindung durch die folgenden Schritte gekennzeichnet: 
Freisetzung von Erregerpartikeln aus erregerhaltigen Proben, nachfolgend Elimination 
30 und/oder Reduktion kontaminierender Wirtsnukleinsauren und abschliefiend Extraktion der 
genomischen Erregemukleins&ure aus freigesetzten Erregerpartikeln. 

Gemass einer Ausfiihrungsform der Erfindung erfolgt die Freisetzung von Erregerpartikeln 
durch Zellyse, Sedimentation, Zentrifligation und/oder Filtration. 

Gemass einer bevorzugten Ausfiihrungsform erfolgt die Ellimination der kontaminierenden 
35 Wirtsnukleinsauren dadurch, dass vor der Extraktion der Erregernukleins&ure ein RNase- 
und/oder DNase-Verdau durchgefiihrt wird. 
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Dies ist besonders dann vorteilhaft, wenn der Erreger ein durch Kapsidproteine geschiitztes 
Virus ist. Da die Kapsidhiille von Viren einen Schutz vor NukJeasen bietet, sind die Erreger 
entsprechend vor der Aktivitat extrazellularer RNasen und DNasen geschiitzt. 

Eine weitere Ausfuhrungsform der Erfindung umfasst daher den Schritt der Elimination 
5 und/oder Reduktion kontaminierender Wirtsnukleinsauren durch RNase und/oder DNase- 
Verdau besonders fur virale Erreger (s. Beispiel Vaccini&virus). Die Dnase Behandlung zur 
Aufreinigung von Viruspartikeln ist dem Fachmann bekannt und kann durchgefuhrt werden 
wie beispielsweise beschrieben bei Dahl R, Kates JR.,Virology 1970 ;42(2):453-62, 
Gutteridge WE, Cover B.,Trans R Soc Trop Med Hyg 1973 ;67(2): 254), Keel JA, Finnerty 
10 WR, Feeley JC, Ann Intern Med 1979 Apr;90(4):652-5 oder Rotten S. in Methods in 
Mycoplasmology, Vol. 1, Academic Press, 1983. 

Eine weitere Moglichkeit, Erreger wie grampositive oder gramnegative Bakterien aus 
Geweben anzureichern, ist wie im erfindungsgemaBen Verfahren angewandt, eine 
15 differenzielle Lyse (nachfolgend auch als sequentielle Lyse bezeichnet) infizierter Gewebe 
mit Detergenzien wie z.B. SDS, die Lipidmembranen auflosen. Hierbei macht man sich den 
Umstand zu Nutze, dass die Zellmembranen eukaryontischer Wirtszellen sehr viel 
empfindlicher auf niedrige Konzentration von SDS reagieren und aufgelost werden, wShrend 
Bakterienwande widerstandsfahiger sind und ihre korpuskulare Integritat erhalten bleibt. 

20 Nach Anreicherung werden die Erregernukleinsauren von den korpuskularen Bestandteilen 
des Erregers abgetrennt und aus dem Erreger freigesetzt. Dies kann mittels dem Fachmann 
bekannten Standardtechniken durchgefuhrt werden, wobei in einer bevorzugten 
Ausfuhmngsform der Erfindung die Abtrennung durch Proteinase K-Verdau, Denaturierung, 
Hitze- und/oder Ultraschallbehandlung, enzymatisch mit Lysozym-Behandlung oder 

25 organische Extraktion erfolgt. 

Die Aufreinigung von BakterienA^iren durch Detergentien wie SDS kann durchgefuhrt 
werden wie bei Takumi K, Kinouchi T, Kawata T., Microbiol Immunol 1980;24(6):469-77, 
Kramer VC, Calabrese DM, Nickerson KW., Environ Microbiol 1980 40(5):973-6, Rudoi 
NM, Zelenskaia AB, Erkovskaia., Lab Delo 1975;(8):487-9 oder Keel J A, Finnerty WR, 
30 Feeley JC, Ann Intern Med 1979 Apr;90(4):652-5, s.a. US Patent 4,283,490. 



Die Erfindung lost das Problem, dass in einem infizierten Gewebe / Organ nur ein Teil des 
Gewebes/Zellen mit dem Erreger infiziert ist. 

35 Die vorliegende Erfindung ist auch geeignet zum Nachweis von Erregern bei Fallen wie z.B. 
Mykobakteriosen, wo nur wenige bis einzelne Erregerpartikel in den infizierten Geweben 
existent sind. 
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Die vorliegende Erfindung hat den Vorteil, das in den Fallen einer Infektion mit nur einer 
geringen Totalmenge an Erregernukleinsauren pro Gewebseinheit (z.B. 50 mm 3 ) der 
Nachweis der Erregers mdglich ist. Als Zahlenbei spiel fur DNA-kodierte Pathogene l&sst sich 
errechnen das ca. 10 6 Viren mit einer durchschnittlichen Genomgrosse von 10000 Basen bzw. 
10 4 Bakterien mit einer durchschnittlichen GenomgroBe von 1.000.000 Basen gerade 10 pg 
Erregernukleinsauren beinhalten. Zudem ist das Genom von den meisten Infektionserregern 
deutlich kleiner als das menschliche Genom (bis Faktor 10 6 bei Viren, bis Faktor 10 4 bei 
Bakterien). Dadurch verdunnt sich der Anteil der Gesamtmenge Erregernukleinsauren 
gegenuber der Gesamtmenge der Wirtsnukleinsauren je nach Kopienzahl und Genomgrdsse 
des Erregers um eine vielfache Zehnerpotenz (Verhaltnis Wirtsnuklein&ure / 
Erregernukleinsaure 10 4 bis 10 9 ). 



Seauenzunabhangige Amplifikation von genomischen Erregernukleinsauren 

Das erfindungsgemafie Verfahren umfasst weiterhin die sequenzunabhangige Amplifikation 
15 genomischer Erregernukleinsauren mittels Polymerase-Kettenreaktion (PCR), die der 
Vermehrung des Ausgangsmaterials dient. 

Hierbei werden PCR-Primer mit Zufallssequenzen (Random-Oligonukleotide) verwendet, so 
dass nicht nur spezifische Genbereiche, sondern moglichst das gesamte Genom des Erregers 
reprasentativ amplifiziert werden kann (unselektive Nukleinsaureampiifikation mit 
20 degenerierten Oligonukleotiden). Diese Primer binden natiirlich auch an Wirts-DNA. Diese 
wurden jedoch, wie oben beschrieben, durch vorhergehenden RNnase- und/oder DNase- 
Verdau bzw. durch selektive Zelllyse reduziert bzw. eliminiert. 

Allerdings ist Eliminierung bzw. Reduktion von Wirts-DNA durch vorhergehenden RNnase- 
und/oder DNase-Verdau bzw. durch selektive Zelllyse nicht zwingend erforderlich in dem 
25 erfindungsgemassen Verfahren. Bei einer hohen Konzentration der Erreger- DNA oder RNA, 
wie sie zum Beispiel in Pusteln oder Virusblaschen ist eine Eliminierung bzw. Reduktion von 
Wirts-DNA nicht erforderlich. 

Der hier verwendete Begriff „genomische Erregernukleinsaure" umfasst sowohl genomische 
DNA als auch RNA. 

30 In einer bevorzugten Ausfiihrungsforni der Erfindung ist die genomische Erregernukleinsaure 
DNA, und ihre sequenzunabhangige Amplifikation erfolgt durch Klenowreaktion mit 
Adaptoroligonukleotiden mit degeneriertem 3*-Ende und nachfolgender PCR mit 
Oligonukleotiden, die der Adaptorsequenz entsprechen. 

In einer weiteren bevorzugten Ausfuhrungsform ist die genomische Erregernukleinsaure ' 
35 RNA, und ihre Amplifikation erfolgt durch reverse Transkription mit degenerierten 
Oligonukleotiden und nachfolgender Amplifikation durch PCR . 



> 



10 
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Wenn nicht bekannt ist, ob der Erreger durch RNA oder DNA kodiert wird, werden beide 
Reaktionen in getrennten ReaktionsgefaBen angesetzt und getrennt amplifiziert. Die 
Amplikons reprasentieren in beiden Fallen genomische Nukleinsaurefragmente. Durch die 
Verwendung von degenerierten Oligonukleotiden wird eine zufellige Amplifikation 
5 (Shotguntechnik) des Gesamtgenoms ermoglicht 

Die Starke des erfindungsgemafien Verfahrens tiegt in seiner hohen Sensitivit&t und Effizienz 
(Ausgangsmengen von wenigen picogramm reichen aus) bei gleichzeitig guter Erhaltung der 
Reprasentanz s&mtlicher Bereiche des Gesamtgenoms. Die gute Reprasentanz der 
mikrobiellen Genabschnitte in den nach dem erfindungsgemassen Verfahren generierten 

10 Bibliotheken wird durch Variationen in der Zwei-Schritt-PCR, wie z.B. Ver&nderungen der 
Salzkonzentration, erreicht. Die hohe Effizienz der Methode mit weitgehender Erhaltung der 
Reprasentanz ertibrigt daher das Anlegen einer Primarkultur zur Vermehrung des Erregers mit 
alien durch sie bedingten Limitationen. Im Falle von unbekannten Erregern sind 
Kulturbedingungen nicht definiert und mussten im trial-and-error- Verfahren approximiert 

15 werden. Auch ist eine Reihe bekannter Erreger schwierig anzuzuchten. Bei Mischinfektionen 
konnen Primarkulturen durch Uberwachsungsphanomene gerade die relevante 
Erregerpopulation ausdunnen. Tote Erreger wurden gar nicht erfasst. Diese Nachteile anderer 
Techniken werden durch das erfindungsgemafie Verfahren umgangen. 

20 

In einer bevorzugten Ausfuhrungsform wird die Sequenz-unspezifische Amplifikation von 
Erregernukleinsauren in zwei sequentiell hintereinandergeschalteten PCR-Schritten von 
jeweils 35-40 Zyklen durchgefiihrt. 

Hierzu wird nach der ersten Amplifikation 1/20 bis 1/50 des Volumens der ersten PCR fur die 
25 Reamplifikation unter variierenden Bedingungen (z.B. Variation der MgCl Konzentration, der 
Pufferbedingungen, der Poylmerasen) genutzt. Durch die Reamplifikation in einer zweiten 
PCR wird wie im Beispiel 3 A dargestellt, eine hohere Sensitivitat des Verfahrens 
gewahrleistet. Die Variation der Re-Amplifikationsbedingungen ermoglicht (siehe Beispiel 6, 
Abbildung 6) eine besonders gute Reprasentation unterschiedlicher Abschnitte des 
30 Erregergenoms und damit eine umfassende Analyse des Erregers. 



Expression amplifizierter Erregernukleinsauren 

Auf die Amplifikation der genomischen Erregernukleinsauren folgt deren Expression. Dazu 
35 werden die Erregernukleinsauren zur Erstellung einer genomischen Expressionsbank des 
Erregers in geeignete Expressionsvektoren kloniert. 
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In einer Ausfuhrungsform der Erfindung sind die Expressionsvektoren ausgewahlt aus der 
Gruppe der viralen, eukaryotischen oder prokaryotischen Vektoren. Im Rahmen der 
Erfindung kdnnen alle Systeme genutzt werden, die eine Expression von rekombinanten 
Proteinen erlauben. 

Nach dem Einbringen der Erregernukleins&uren in die Vektoren werden die Vektoren 
bevorzugt in Lambda-Phagen verpackt 

In einer bevorzugten Ausfuhrungsform der Erfindung wird die Expression der 
Erregernukleins&uren durch Einbringen der Erregernukleinsaure in Lambda-Phagen Vektoren 
(z.B. Expressionsvektor Lambda-ZAP-Express, US Patent Nr. 5.128.256) gew&hrleistet. 
Alterhativ kdnnen auch andere Vektoren, die dem Fachmann bekannt sind, eingesetzt 
werden, besonders bevorzugt sind filamentdse Phagen- Vektoren, eukaryontische Vektoren, 
retrovirale Vektoren, adenovirale Vektoren oder Alphavirusvektoren. 



/ 

Screening and Identifizierung der biologisch aktiven Struktur. 

Der abschlieBende Schritt des erfindungsgemaBen Verfahrens umfasst das Screening der 
genomischen Expressionsbank und die Identifizierung der biologisch aktiven Struktur des 
Erregers durch Immunantworten infizierter Wirte. 

Der hier verwendete BegrifF „biologisch aktive Struktur" bezeichnet Erregerantigene, 
enzymatisch aktive Proteine oder Pathogenit&tsfaktoren des mikrobiellen Erregers. 

Gem&fi einer bevorzugten Ausfuhrungsform der vorliegenden Erfindung stellt das Screening 
ein Immunoscreening auf Erregerantigene dar und die Identifikation von Erregerantigenen 
umfasst die folgenden Schritte: Infektion von Bakterien mit Lambda-Phagen, Kultivierung 
der infizierten Bakterien unter Bildung von Phagenplaques, Transfer der Phagenplaques auf 
eine Nitrozellulosemembran (oder einer anderen Festphase, die zur Immobilisierung von 
rekombinanten aus den Erregern abgeleiteten Proteinen geeignet ist), Inkubation der 
Membran mit Serum oder antikorperhaltigen Korperflussigkeiten des infizierten Wirtes, 
Waschen der Membran, Inkubation der Membran mit sekund&rem alkalische Phosphatase- 
gekoppeltem anti-IgG-Antikdrper der spezifisch fur Immunglobuline des infizierten Wirtes 
ist, Nachweis der mit Wirtsserum reaktiven Klone durch Farbreaktion, und die Isolierung und 
Sequenzierung der reaktiven Klone. 

GrundsMzlich ist es zur Identifikation der biologischen aktiven Struktur auch moglich, 
Erregernukleinsauren in rekombinante filamentfise Phagen- Vektoren (z.B. pJufo) 
einzubringen, die eine Expression von Antigenen direkt auf den Oberflachen der filamentosen 
Phagen erlauben. In diesem Fall wiirde die Identifikation von Erregerantigenen die folgenden 
Schritte umfassen: Generierung von rekombinanten filamentosen Phagen durch Einbringen 
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der filamentdsen Phagenvektoren in Bakterien, Inkubation generierter 

rekombinanter filamentoser Phagen mit Serum eines infizierten Wirtes, Selektion der 
filamentdsen Phagen, an die Immunglobuline des Wilts gebunden haben, uber immobilisierte 
Reagenzien die spezifisch fur die Immunglobuline des infizierten Wirts sind, und Isolierung 
5 und Sequenzierung der selektierten Klone. 

Vom Erregergenom abgeleitete und rekombinant exprimierte Proteine konnen z.B. auf 
Festphase gebunden oder im Rahmen eines Panning-/Captureverfahrens mit spezifischen 
Immunantwortaquivalenten des infizierten Wirtes gescreent werden. Dies sind zum einen 
Antikdrper verschiedener Immunglobulinklassen/-subklassen, in erster Linie IgG. Zu diesem 
10 Zweck wird Wirtsserum verwendet. Dies sind aber auch spezifische T-Lymphozyten gegen 
MHC-restringiert erkannte Epitope von Erregerantigenen, die in einem eukaryotischen 
System getestet werden mussen. 

Die Herstellungsbedingungen fur die genomische Bank erfolgt so, dass die inserierten 
Fragmente aufgrund der Eigenart der PCR-Primer nach dem Zufallsgeneratorprinzip 

15 entstehen. Entsprechend sind Bereiche aus bekannten Antigenen reprasentiert, die 
natiirlicherweise auch als Proteine gebildet wiirden. Auch Fragmente aus normalerweise nicht 
exprimierten intergenen Bereichen konnen entstehen, die je nach L&nge ofiFener Leseraster zur 
Expression kurzer Nonsensproteine oder -peptide fiihren konnen. Ein wichtiger Aspekt ist, 
dass im erfindungsgemaflen Verfahren automatisch auch bisher nicht identifizierte 

20 Erregerproteine vorliegen kdnnen. 

Detalierte Beschreibung bevorzugter Ausfuhrungsformen der vorliegenden Erfindung 

Die vorliegende Erfindung kombiniert die Expression der Gesamtdiversitat aller erdenklichen 
rekombinanten Proteine mit der anschlieDenden Anwendung eines sehr stringenten Filters, 
25 namlich die in infizierten Wirten im Rahmen des naturlichen Verlaufes der Erkrankung 
entstehende spezifische Immunantwort. 

In einer weiteren Ausfiihrungsform der Erfindung werden die Erreger vor der 
Nukleinsaureamplifikation durch FSllung mit Polyethylenglykol, Ultrazentrifugation, 
Gradientenzentrifugation oder durch Affinitatschromatographie angereichert. Dieser Schritt 
30 ist jedoch nicht zwingend vorgesehen. 

Die F&llung mit Polyethylenglykol ist vor allem bei viralen Partikeln efiBzient. Alternativ 
bietet sich bei bekannten Erregern die Affinitatschromatographie unter Nutzung von 
erregerspezifischen Antikdrpern gegen definierte und stabile Oberflachenstrukturen an. Eine 
weitere Alternative ist bei unbekannten Erregern die Nutzung des polyklonalen 
35 Patientenserums selbst moglich, wobei das polyklonalen Patientenserums auf der Festphase 
immobilisiert und zur Affinitatsanreicherung von Erregern als spezifisches Capture-Reagenz 
verwendet wird. 
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Das hier beschriebene Verfahren kann als Plattformtechnologie eingesetzt werden, um 
hocheffizient Antigen-kodierende Erregernukleinsauren aus geringsten Mengen 
erregerhaltigen Materials zu identifizieren. Wie in den nachfolgenden Beispielen gezeigt, sind 
1 bis 20 pg genomische Nukleinsaure ausreichend, um eine umfassende Identifikation des 
5 durch natiirliehe Immunantworten serologisch erkannten Antigenrepertoires einzelner Erreger 
zu leisten. So konnten mit der hier beschriebenen Technologie z.B. fur das Vacciniavirus als 
immunodominant bekannte Antigene ausgehend von 20 pg DN A identifiziert werden. 

Die geringe Menge an Nukleins&uren, die fUr dieses Verfahren benotigt wird, ermoglicht die 
Anwendung des Verfahrens fur medizinisch wichtige Fragestellungen, die mit den bisher 
10 bekannten Verfahren schlecht oder gar nicht bearbeitet werden konnten. 

Hierzu zahlt z.B. die systematische direkte Identifikation von Erregernukleinsauren aus 
infizierten Zellen, z.B. empfangliche in vitro Zellinien, Organe, entzundliche LSsionen wie 
z.B. Pusteln auf der Haut, auf Schleimhauten, aus infizierten inneren lymphatischen und 
nicht-lymphatischen Organen oder aus erregerhaltigen Flussigkeiten (z.B. Speichel, Sputum, 

15 Blut, Urin, Eiter, Ergusse), die von infizierten Organismen gewonnen werden. Ausgehend von 
einer Sensitivitat von 1 pg sind je nach Genomgrdsse des Erregers (z.B. Viren 3.000 - 
250.000 bp oder Bakterien 100.000 - 5.000.000 bp) 50 bis 10 3 Erregerpartikel ausreichend, 
um fur Antigene kodierende Erregernukleinsauren zu identifizieren. Es ist zu erwarten, dass 
in den meisten Fallen die Anzahl von Erregerpartikeln weit uber der Sensitivit&tsgrenze des 

20 erfindungsgem&Ben Verfahrens liegt. 

Die hohe Sensitivitat des erfindungsgemaBen Verfahrens erlaubt, wie bereits vorstehend 
beschrieben, eine Untersuchung von Erregern aus Prim&risolaten ohne Notwendigkeit einer in 
vitro Kultur. Besonders wichtig ist, dass sehr kleine Mengen von Ausgangsmaterial, wie z.B. 
Stecknadelkopf-grosse Biopsien oder wenige Microliter infizierte Proben-Flussigkeiten fur 
25 die erfolgreiche Anreicherung und Identifikation von biologisch aktiven Strukturen durch das 
erfindungsgemasse Verfahren ausreichen. Hiermit kann das erfindungsgemasse Verfahren 
auf jegliches UberschuBmaterial aus der medizinisch-klinischen Diagnostik und auf 
kiyoarchivierte Probenmaterialien zugreifen (im Beispiel 9 dargestellt). 

Die Sequenzierung der anhand des erfindungsgemaBen Verfahrens identifizierten 
30 Erregernukleins&ure fiihrt zur Identifikation des Erregers, aus dem die Nukleinsaure 
ursprunglich stammt. Damit ist eine vorherige Kenntnis des Erregers nicht notwendig und das 
Verfahren eignet sich zur Entdeckung von bisher nicht definierten Infektionserregern bzw. zu 
bisher nicht bekannten Antigenen. 

Das Verfahren kann somit zur Untersuchung einer Reihe von Erkrankungen eingesetzt 
35 werden, bei denen ein Infektionserreger atiologisch vermutet wird, aber noch nicht 
identifiziert werden konnte. Hierzu zahlen Erkrankungen, welche die Koch'schen Postulate 
teilweise erfiillen (z.B. Ubertragbarkeit), bei denen jedoch die Keime aufgrund von fehlender 
Anzuchtbarkeit/Isolierbarkeit der Erreger nicht identifiziert werden konnen. Weitere Beispiele 
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sind Erkrankungen wie die Sarkoidose, Pitrysiasis rosea, Multiple Sklerose, Diabetis 

Mellitus und Morbus Crohn. 

Auch bei einem Teil von Patienten mit atiologisch unklarer chronischer Hepatitis (chronische 
non-B, non-C Hepatitis) wird eine bisher unbekannte Viruserkrankung vermutet Die 
5 Keimzahlen im Serum von Patienten mit bekahnter chronischer Virushepatitis sind hoch. So 
finden sich bei Patienten mit infektioser chronischer HBV- bzw. HCV-induzierter Hepatitis in 
1 ml Blut 10 7 -10 8 Hepatitis B- bzw. Hepatitis C-Partikel. Unter der Annahme einer ann&hemd 
vergleichbaren Keimzahl ist das erfindungsgemaBe Verfahren auch dazu geeignet, putative 
non-B, non-C Hepatitis-Erreger ausgehend aus geringen Mengen Blut/Serum (1-10 ml) 
1 0 infizierter Patienten zu identifizieren. 



Der Schritt des Immunoscreening der vorliegenden Erfindung als hochsensitives und 
hochspezifisches Hochdurchsatz-Detektionsverfahren erlaubt die Identifikation einer Antigen- 
kodierenden Nukleinsaure unter 10 6 -10 7 nicht-immunogenen Klonen. 

15 Hierzu reicht eine geringe Reinheit der Erregernukleinsauren zur Identifizierung des Erregers 
aus. Diese geringe Reinheit kann problemlos durch verschiedene aus dem Stand der Technik 
bekannte Verfahren, wie z.B. Prazipitation von Erregerpartikeln mit Polyethylenglykol (PEG) 
und/oder Affiiutatschromatographie und/oder Degradation von kontaminierenden 
Wirtsnukleinsauren mit Nukleasen erreicht werden. 

20 Eine zus&tzliche Moglichkeit zur Anreicherung von Erregerpartikeln ist die Nutzung der in 
infizierten Organismen gegen Erregerpartikel gebildeten spezifischen Antikiirper fur Capture- 
Verfahren. 

Das Immunoscreening als integraler Bestandteil des Verfahrens erlaubt die Analyse von 10 6 - 
5xl0 6 Klonen innerhalb von kurzer Zeit (2 Monaten) durch eine einzige Person. Die 

25 Kombination aus sequenzunabhangiger Amplifikation und serologischer Untersuchung mit 
hohem Durchsatz aller Nukleinsaureabschnitte in alien 6 Leserastem erlaubt schon bei 
maBiger Reinheit der Ausgangsnukleins&uren (Erregernukleinsauren > 1% der 
Gesamtnukleinsauren) die umfassende Untersuchung aller potentiell fur Polypeptide 
kodierenden Regionen unabhangig vom aktuellen Expressionstatus. Durch die Untersuchung 

30 von genomischen Nukleinsauren werden aHe Genregionen erfasst, auch Gene, die nur zu 
bestimmten Zeitpunkten (z.B. nur in bestimmten Infektionszeitphasen) eingeschaltet werden. 
Dies erlaubt nicht nur eine Aussage uber einzelne Antigene, sondern gibt auch Informationen 
uber die Gesamtheit der Nukleotid-kodierten immunogenen Regionen (Immunom, siehe 
Abbildung 4A-C und 5). Uber die Identifikation multipler z.T. uberlappender Fragmente wird 

35 dariiberhinaus eine Einengung des serologisch erkannten Epitops innerhalb eines 
identifizierten Antigens ermoglicht (siehe Abbildung 4A-C). Die Starke des Signals 
ermoglicht eine weitere Diskriminierung von dominanten und nichtdominanten Epitopen 
(siehe Abbildung 4A-C). Die identifizierten Erreger-Nukleinsaurefragmente sind direkt fur 
die Entwicklung von Serodiagnostika und Impfstoffen verfugbar. Die identifizierte 
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Nukleins&ure kann als Matrize fur die Entwicklung hochsensitiver direkter 
Erregernachweismethoden z.B. durch Anwendung von Nukleinsaure-spezifischer 
Amplifikation uber die Polymerasekettenreaktion (PCR) genutzt werden. Die identifizierten 
Fragmente konnen auch fur die Entwicklung von Diagnosetests basierend auf dem Nachweis 
5 von Antigen-spezifischen T-Lymphozytenreaktionen genutzt werden. 

Die Abgrenzung gegen Technologien wie >y Proteomics" ist schon in der Einleitung diskutiert 
worden. Das erfindungsgem&Be Verfahren unterscheidet sich technisch gegenuber zwei 
weiteren verwandten Methoden: die serologische Untersuchung von genomischen 
Erregerbibliotheken und der SEREX-Technologie. 

10 Fur die serologische Untersuchung von genomischen Bibliotheken wurden von einigen 
Gruppen (z.B. Luchini et al. (1983), Curr Genet 10:245-52, Bannantine et al. (1998), 
Molecular Microbiology 28: 1017-1026) Expressionsbibliotheken aus aufgereinigter 
mechanisch zerkleinerter oder enzymatisch verdauter Erreger-DNA hergestellt. Fur die 
Herstellung von Expressionsbibliotheken mit diesem Verfahren werden zur Herstellung 

15 reprasentativer Banken je nach GroBe des Genoms zwischen 0,5 - 5 pg an aufgereinigten 
Erregernukleinsauren benotigt (Faktor 10 5 -10 6 Mehrbedarf an Erregernukleins&uren). Hiermit 
verschlieBt sich die Methode der Untersuchung von Erregern aus Primarisolaten, in denen 
weitaus geringere Mengen an Erregern und Erregernukleinsauren vorhanden sind. Es ist hier 
unumganglich, dass die Erreger isoliert, in vitro angezuchtet und anschlieBend aufwendig 

20 aufgereinigt werden. Damit miissen als Grundvoraussetzungen zur Anwendung dieser 
Methode die Kultur- und Aufreinigungsmodalitaten fur den jeweiligen Erreger bekannt und 
zuvor etabliert sein. Dies ist jedoch gerade fur viele Viren und intrazellulare Erreger technisch 
aufwendig und verlangt eine groBe Expertise. Damit entfallt auch die Moglichkeit, 
unbekannte Erreger, sowie solche, die nicht mehr vital sind, zu identifizieren. 

25 Eine weitere Abgrenzung ist gegenuber der mit SEREX (Sahin et al. (1995), Proc Natl Acad 
Sci USA 92: 11810-3; Sahin et al. (1997), Curr Opin Immunol 9, 709-716) bezeichneten 
Methode vorzunehmen. Fur SEREX wird aus erkrankten Geweben mRNA extrahiert, cDNA- 
Expressionsbibliotheken hergestellt und mit Seren desselben Individuums, aus dem das 
Gewebe stammt, auf immunreaktive Antigene gescreent. 

30 Ein wesentlicher Unterschied zum erfindungsgemaBen Verfahren besteht darin, dass fur die 
SEREX-Methode cDNA-Expressionsbibliotheken aus Wirtszellen infizierter Gewebe 
verwendet werden. 

Die unterschiedliche Qualitat und der unterschiedliche Ursprung der Nukleinsauren fuhrt zu 
folgenden Unterschieden: 

35 Die Verwendung von Gesamt-mRNA aus Wirtszellen erhdht bei SEREX die Komplexit&t der 
Bibliothek und vermindert die Wahrscheinlichkeit der Identifikation Erreger-abgeieiteter 
Transkripte. Fttr tierische Wirtszellen ist von 40.000 bis 100.000 unterschiedlichen 
wirtseigenen Transkripten auszugehen. Die Anzahl der Transkripte fur die meisten Erreger 
liegt weitaus geringer (Viren 3-200 Transkripte, Bakterien 500-4000 potentielle 
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Genprodukte). Zusatzlich ist in den meisten Fallen nur ein geringer Teil von Wirtszellen 
mit Erregern infiziert, so dass der Anteil Erreger-abgeleiteter Nukleins&uren in der Gesamt- 
mRNA Population sich weiter verdunnt. Da viele wirtseigene Transkripte auch fur naturliche 
oder krankheitsassozierte Autoantigene kodieren (Sahin et al., 2000, Scanlan et al. (1998), Int 
5 J Cancer 76, 652-658) ist die Identifikation von Erreger-abgeleiteten Antigenen durch die 
praferentieUe Detektion von Wirts-Gewebsautoantigenen sehr erschwert Dieser Umstand ist 
verantwortlich dafur, das mit der SEREX-Technologie bei der Untersuchung von mehreren 
infizierten Geweben, wie z.B. von HBV-Ag+ Leberzell-Karzinomen (Scanlan et al. (1998), 
Int J Cancer 76, 652-658; Stenner et al. (2000), Cancer Epidemiol Biomarkers Prev 9, 285- 
1 0 90) bisher noch keine Erregerantigene identifiziert worden sind. 

Aus den nachfolgenden Abbildungen und Beispielen wird ersichttich, dass mit dem Verfahren 
der vorliegenden Erfindung aus geringsten Mengen von Erregernukleins&uren 
immunologisch relevante virale und bakterielle Antigene identifiziert und charakterisiert 
werden konnen. Die in den nachfolgenden Beispielen identifizierten viralen Antigene waren 

15 dabei uber das gesamte Genom des Vacciniavirus verteilt, was auf eine gute Reprasentanz der 
verschiedenen Gene in der mit Hilfe des erfindungsgemassen Verfahrens amplifizierten DNA 
schlieBen lasst (siehe Abb. 5). Eines der in den Beispielen identifizierten Antigene evoziert 
sogar neutralisierende Antikorper und ist somit im therapeutischen Zusammenhang von 
groBer Wichtigkeit. Somit ist das Verfahren auch fur die Auffindung von fur die Therapie 

20 wichtiger Antigene geeignet. 

Das erfindungsgemasse Verfahren wurde in den vorliegenden Beispielen fur die Identifikation 
von viralen und bakteriellen Antigenen eingesetzt. ErfindungsgemaB werden fur bakterielle 
Erreger vorzugsweise die folgenden SDS-Konzentration zur Anreicherung von gramnegativen 
bzw. grampositiven Erregern eingesetzt (siehe Abb. 8): Fiir Gram-positive Bakterien >0,05% 
25 bis 1% und fiir Gram-negative Bakterien 0,05% bis 0, 1% SDS. 

Wenn keine Anhaltspunkte vorliegen, ob ein Erreger ein Virus oder ein Bakterium ist, kann 
aufgrund der sehr geringen bendtigten Materialmenge die Ausgangsprobe aufgeteilt werden 
(z.B. auf zwei ProbengefaBe) und unter der Annahme eines ursftchlichen viralen bzw. 
bakteriellen Erregers methodisch unterschiedlich verarbeitet werden (Abb. 12). 

30 

In einem weiteren Aspekt betrifft die vorliegende Erfindung neue Vaccinavirusantigene, 
dadurch gekennzeichnet, dass das Antigen von einer Nukleinsaure kodiert wird, die 80% 
Homologie, insbesondere 90% Homologie und vorzugsweise 95% Homologie zu einer der 
Sequenzen SEQ ID NOS: 4,5,6,7,8,9,10, 11,12, 13, 14, 15, 16 ,17, 18 ,19, 20, 21 oder 22 
35 aufweist. 

Besonders bevorzugt sirid Vaccinavirusantigene, die dadurch gekennzeichnet sind, dass das 
Antigen von einer der Nukleinsauren SEQ ID NOS: 4,5,6,7,8,9,10, 11,12, 13, 14, 15, 16 ,17, 
1 8, 19, 20, 21 oder 22 codiert wird. 
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Die erfindungsgemaBen Vaceinaantigene die durch das erfindungsgemaDe Verfahren 
identifiziert wurden sind im Beispiel 5 und Tabelle 3 n&her beschrieben. Bevorzugte 
Nukleinsfiuresequenzen, die die Vaccinavirusantigene codieren sind im Sequenzprotokoll als 
SEQ IDNOS: : 4,5,6,7,8,9,10, 11,12, 13, 14, 15, 16 ,17, 18,19, 20, 21 oder22 dargestellt. Die 
5 bevorzugten Nukleins&uresequenzen sind zus&tzlich in Abildung 13 dargestellt.. 

In weiterer Aspekt der Erfindung betrifft daher auch die Verwendung der Nukleinsauren SEQ 
ID NOS: 4-22 und Nukleinsfturen, die mit diesen 80, 90 oder 95% Homologie aufweisen in 
Nachweisverfahren des Vaccinavirus. Derartige Nachweisverfahren sind dem Fachmann 
bekannt. 

10 Weitere Verwendungen fur die erfindungsgemaBen Vacciniavirusantigene: 

- Moglicher serologischer Nachweis von Variola major (Erreger der Pocken) fiber 
konservierte Epitope in Vacciniavirusantigenen. Variola major ist einer immunologischen 
Analyse nicht zuganglich, da in Milit&rlaboren verschlossen. 

- Impfung gegen Variola major mit Subunitvakzinen. Die Impfung mit dem Vacciniavirus 
15 erzeugt einen guten Schutz gegen den Pockenerreger. Einzelne Vacciniavirusantigene sind 

daher potenzielle Kandidaten fur die Induktion von immunologischem Schutz gegen den 
Pockenerreger. 



20 

Die folgenden Abbildungen dienen der Erlauterung der Erfindung: 

Abb.l. Schematische Darstellung der aufeinanderfolgenden Analyseschritte einer 
Ausfuhmngsform des erfindungsgemaBen Verfahrens. 

Abb 2A Amplifikation unterschiedlicher Ausgangsmengen von Erregernukleinsauren. 

25 Klenow-getaggte Vacciniavirus-DNA wurde wie im Beispiel 3 A erlautert einmalig fur 35 
Zyklen amplifiziert (PCR1) bzw. 1 \il fur weitere 35 Zyklen reamplifiziert (Re-PCRl). Als 
Ausgangsmengen fur die Amplifikation dienten 1 ng (Spur 1), 40 pg (Spur 2), 8pg (Spur 3), 
0,8pg (Spur 4), bzw 0,08pg (Spur 5) Klenow-Enzym getaggte Vacciniavims-DNA. Spur 6 
stellt die Negativkontrolle ohne Zugabe von Vacciniavirus-DNA dar. 

30 Abb. 2B. Amplifikation von Vacciniavirus-DNA; die Amplifikation der Vacciniavirus-DNA 
wurde durch eine Klenow-Enzym-Reaktion eingeleitet (links), fur die Adaptoroligonukleotide 
mit degeneriertem 3'-Ende fiir ein sequenzunabhangiges Priming verwendet wurden. Darauf 
folgt die eigentliche PCR-Amplifikation mit Oligonukleotiden, die der Adaptorsequenz 
entsprechen. Die beschriebenen PCR-Bedingungen fiihrten zu Fragmenten unterschiedlicher 

35 Lange (200-2500 bp) (rechts). 
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Abb. 3. Abb. 3 zeigt das Immunoscreening und die Identifizierung des 39kDa Antigen 
Klon 3 (288-939) und des ATI Antigen Klon 1 (511-111). Anfanglich im Screening 
identifizierte Klone wurden zunachst oligoklonal unter Zunahme von benachbarten nicht- 
reaktiven Phagenplaques isoliert und nach Bestatigung monoklonalisiert. 

5 Abb. 4A. Abb. 4A zeigt Klon 1 (288-688), Klon 2 (288-788) und Klon 3 (288-938), die fur 
uberlappende Bereiche aus dem 39kDa-Protein von Vacciniavirus kodieren. Die Klone sind 
unterschiedlich inununreaktiv. 

Abb. 4B. Abb. 4B zeigt drei Klone, die fur uberlappende Bereiche des A-type inclusion 
protein (ATI) von Vacciniavirus kodieren und gleiche Immunreaktivitat aufweisen. 

10 Abb. 4C. Abb. 4C zeigt drei Klone, die fur uberlappende Bereiche des plaque size /host range 
protein (ps/hr) von Vacciniavirus kodieren und unterschiedlich inununreaktiv sind. 

Abb. 5. Abb. 5 zeigt die Verteilung der mit dem erfindungsgem&Ben Verfahren identifizierten 
Klone im Vacciniavirusgenom. Die identifizierten Antigene sind iiber das ganze 
15 Vacciniagenom verteilt, was auf eine gute Reprasentanz der Vacciniavirusgene in der iiber 
das erfindungsgemaBe Verfahren hergestellten Bibliothek schlieBen lasst 

Abb. 6. Abb. 6 zeigt die molekulare Analyse der Reprasentanz von zehn arbitrar 
ausgesuchten Vacciniavirusgenen in der durch das erfindungsgemasse Verfahren 

20 amplifizierten Vacciniavirus DNA. Zehn Genabschnitte aus dem Genom des Vacciniavirus 
wurden per PCR synthetisiert. Je 10 ng der 317 bis 549 bp langen Genabschnitte wurden 
durch Gelelektrophorese in Agarosegelen aufgetrennt, ilber das Southern Blotting- Verfahren 
auf eine Nylonmembran uberfuhrt. Fur die Herstellung der 32 P-markierten Sonde wurden in 
10-20 pg Vaciniavirus-DNA eingesetzt. Abb. 6 A zeigt die Hybridisierung mit PCR- 

25 Fragmenten aus einer einzigen Re-PCR. Abb. 6B zeigt die Verbesserung der Reprasentanz 
indem gepoolte Fragmente aus mehreren wie im Beispiel 2 beschrieben variierten Re-PCRs 
fur die Hybridisierung eingesetzt wurden. Die Hybridisierung der gepoolten amplifizierten 
DNA mit den geblotteten zehn zufallig ausgewahlten Abschnitten (sichtbar als schwache bis 
deutliche Schwarzung) des Vacciniavirusgenoms zeigt, dass alle Abschnitte in der 

30 amplifizierten DNA enthalten sind. Herauszustellen ist, dass selbst das Gen mit dem 
schw&chsten Hybridisierungssignal (Spur 2, 94kDA A-Type inclusion protein, ATI) im 
Immunoscreening der Bibliothek 30-mal als Antigen identifiziert wurde (s. Tabelle 3). 

Abb. 7A. Abb. 7A zeigt die Bestimmung des Serumtiters gegen das durch das 
35 erfindungsgemasse Verfahren klonierte immundominante 39 kDa Antigen des Vacciniavirus. 
Serum von C57BL/6 MSusen wurde am Tag 21 nach Infektion mit dem Vacciniavirus 
gewonnen und wie angegeben verdunnt. Zur Produktion des Antigens wurden E. coli 
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Bakterien mit einem das 39 kDa Antigen kodierenden Lambaphagen infiziert. Die 
Reaktivitat der Serum verdunnungen gegen das so rekombinant exprimierte 39 kDa Antigen 
wurde auf NitroGellulosemembranen getestet. Fur das hier venvendete Serum ist der 
Antikorpertiter >1 : 16000. 

5 Abb. 7B. In Abbildung 7B ist der Verlauf des Antikorpertiters gegen das 39 kDa Antigen 
nach Infektion mit 2xl0 6 pfu Vacciniavirus oder mit 2xl0 5 pfu des Lymphocytaren 
Choriomeningitisvinis (Stamm WE) dargestellt. Nicht infizierte Tiere (naiv) zeigen keine 
Reaktivitat gegen das 39 kDa Antigen. Die hohe Spezifitat der Reaktion ist auch durch die nur 
minimale Kreuzreaktivitat mit dem Serum aus mit dem Lymphocytaren 
10 Choriomeningitisvirus infizierten M&isen (Tag 14) gezeigt. 



Abb. 8. Abb. 8 zeigt die unterschiedliche Empflindlichkeit von eukaryontischen Zellen und 
gramnegativen bzw. grampositiven Bakterien. Fur das Experiment wurden vergleichbare 
Zellvolumina von gramnegativen Bakterien (oben), grampositiven Bakterien (Mitte) bzw. 

15 eukaryontischen Zellen mit den angegebenen Konzentrationen von SDS inkubiert Nicht 
lysierte korpuskulare Strukturen wurden durch Zentrifugation pelletiert. Wahrend 
eukaryontische Zellen bereits bei geringsten Konzentrationen vollstandig von SDS lysiert 
werden (kein sichtbares Zellpellet, mikroskopisch keine sichtbaren Zellen) sind Bakterien 
widerstandsfahiger und konnen, da ihre korpuskulare Integritat erhalten blieb, durch 

20 Zentrifugation angereichert werden. 

Abb. 9. Abb. 9 zeigt die Identifikation und molukulare Charakterisierung von putativen 
Antigenen des humanpathogenen Bakteriums Tropheryma whippelii. Interleukin-10 und 
Interleukin-4 deaktiverte humane Makrophagen wurde mit T. whippelii Bakterien 
enthaltendem Gehirnmaterial eines an der Whippleschen Erkrankungen verstorbenen 

25 Patienten inkubiert. Bakterienspezifische Gene wurden durch differenzielle Lyse und 
anschliessende DNA-Aufarbeitung isoliert und Bibliotheken nach dem erfindungsgemassen 
Verfahren konstruiert. Das Immunoscreening wurde mit Seren von T. whippelii infizierten 
Patienten durchgefuhrt. Die bioinformatische Analyse, d.h. der Abgleich mit offentlich 
zuganglichen Sequenzdatenbanken, zeigt, dass bisher nicht bekannt bakterielle Antigene 

30 durch das erfindungsgemasse Verfahren identifiziert wurden. 



Abbildung 10: Isolation von Bakterien direkt aus dem Milz-Gewebe eines Patienten mit 
Whipple-Disease. Bakterien wurde aus einer kryopraservierten Milzprobe eines Patienten mit 
Whipple-Disease wie im Beispiel 9 dargestellt isoliert und fluoreszensmikroskopisch 
35 analysiert. Das Bild zeigt die Uberlagerung die Aufhahme im Phasenkontrast (Nachweis 
korpuskularer Partikel, oben) und nach Uberlagerung mit blauen Fluoreszenssignal (Nachweis 
DNA). 
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Abbildung 11 A: Anreicherung von Erregernukleinsauren direkt aus einer 
Patientenprobe wie in Beispiel 9 beschrieben. 

Abbildung 11B: Amplifikation von direkt aus Patientenproben isolierten 
Erregernukleinsauren. Die aus der Milzprobe angereicherte Bakterien-DNA wurde wie im 
5 Beispiel 10 beschrieben amplifiziert (Spur 2). Spur 1 stellt die Positivkontrolle mit einer 
anderen DNA-Probe dar. Auf Spur 3 ist die Negativkontrolle ohne Zusatz von DNA 
aufgetragen. 

Abbildung 12: Schema eines moglichen Vorgehens fur die Identifikation von 
Erregerantigenen fur den Fall, dass nicht bekannt ist, ob der Erreger ein Virus oder ein 
10 Bakterium darstellt. Die Ausgangsprobe wird aufgeteilt und mittels unterschiedlicher, die 
Identifikation von bakteriellen bzw. viralen Erregern ermoglichenden Verfahren verarbeitet. 

Abbildung 13: Abbildung 13 zeigt die Nukleinsauresequenzen der in Tabelle 3 aufgelisteten 
identifizierten Vacciniavirusantigene. Die Nukleinsauresequenzen entsprechen den Sequenzen 
SEQ ID NO: 4 bis SEQ ID NO: 22 im Sequenzprotokoll. 

15 

Die vorliegende Erfindung wird weiterhin durch die folgenden Beispiele in nicht- 
limitierender Weise veranschaulicht. 



Beispiele 
20 Beispiel 1 

Isolierung von Erregernukleinsauren aus Virus-infizierten Zellen: 

BSC40 Zellen wurden mit 2x1 0 6 pfu Vacciniaviren infiziert. Infizierte Zellen wurden bei 
37°C im C02-Inkubator 24 h inkubiert und geerntet. Geerntete Zellen wurden anschlieBend 
homogenisiert und in gepuffertem Medium aufgenommen. Zur Trennung von Viruspartikeln 

25 von Wirtszellfragmenten wurde das in Medium aufgenommene Zellysat anschlieBend mit 
Ultraschall behandelt. Grobpartikulare Strukturen wurden durch Zentrifugation 15min x 3000 
U/min pelletiert. Nach Zentrifugation wurde der Uberstand abgenommen und das Pellet 
verworfen. Um korpuskulare Partikel im Uberstand zu prazipitieren, wurde 2 ml gekuhlter 
Uberstand mit 6% PEG6000/0,6M NaCl prazipitiert (lh Inkubation auf Eis) und nachfolgend 

30 das Prazipitat mittels Zentrifugation bei 10000 x g fur 10 min pelletiert. Da die 
vorhergehenden Schritte sowohl eine Abtrennung als audi eine Lyse kontaminierender 
Wirtszellen erbracht haben sollten, wurde jetzt nach Verwerfen des Uberstandes das Prazipitat 
in 300 \il DNAse/RNAse Puffer aufgenommen und 30 min bei 37°C mit RNAse und DNAse 
verdaut. Hierdurch wurden die nun extrazellular vorliegenden Nukleinsauren der vorher 

35 desintegrierten Wirtszellen eliminiert. Die Virusnukleinsauren werden durch die intakte 
Viruskapsid vor den Nukleasen geschiitzt und nicht degradiert Viruspartikel wurden durch 
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vortexen mit 1 Volumen GITC-Puffer aufgeschlossen, was auch zur Inalctivierung 
der zugegebenen Nukleasen fuhrt. Freigesetzte EiTeger-DNA wurde mit Pheno^ 
extrahiert und mit 1 Isovolumen Isopropanol geftllt. Die gefallten Nukleinsauren wurden mit 
80% Ethanolol gewaschen und in 20 \il H 2 0 dest. aufgenommen. 



Beispiel 2 

Infektion mit Vacciniavirus und Serumgewinnung 

Rekombinantes Vacciniavirus mit dem Glykoprotein des Vesikularen Stomatitis Virus 
(VaccG) (Mackett et al.(1985), Science 22? \ 433-435.) wurde auf BSC40 Zellen gezuchtet 
und die Vimskonzentration im Plaque-Assay bestimmt. C57BL/6 M&use (Institut fiir 
Labortierkunde, Universitat Zurich) wurden i.v. mit 2 x 10 6 pfii VaccG infiziert. Den Mausen 
wurden 200-300 ^1 Blut an den Tagen 8, 16 und 30 nach Infektion entnommen und Serum 
wurde durch Zentrifugation gewonnen und bei -20°C gelagert. 

Nach erfolgter Immunisierung der Mause wurde die erfolgreiche Induktion von anti- 
Vacciniaantikorpern im Neutralisationsassay gegen VSV getestet (Ludewig et al.. 2000. Eur J 
Immunol. 30:185-196), um den besten Zeitpunkt der Serumabnahme fur die geplanten 
Analysen zu ermitteln. Wie in Tabelle 1 dargestellt, hat ab Tag 16 der Anstieg sowohl des 
Gesamt-Immunglobulin, als auch der IgG-Klasse ihr Maximum erreicht, so dass dieses Serum 
der Abnahmetage 16 und 30 verwendet werden konnte. 



Tabelle 1: Titerveriauf von Antikorpern nach Immunisierung mit Vacciniavirus 



Tag post inoculationem Gesamt-Immunglobulin IgG 
(in 40xlog2) (in 40xlo g 2) 

8 9 6 

16 12 11 

30 12 12 



Beispiel 3A Globale Amplifikation geringster Mengen an Erreger-Nukleinsauren 

Die globale Amplifikation von genomischen Nukleinsauren des Erregers ist ein essentieller 
Schritt in dem erfindungsgemassen Verfahren. Hierbei ist die Hauptherausforderung die sehr 
geringe Menge genomischer Keimnukleinsauren, die (ohne Vorkultur) aus infizierten 
Geweben isoliert werden, umfassend (d.h. moglichts alle Abschnitte des Genoms 
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miteinsehliessend) zu amplifizieren. Zudem muss die amplifizierte DNA fur das 
nachfolgende Screening exprimierbar und klonierbar sein. W&hrend PCR-amplifizierte 
cDNA-Expressionsbibliotheken vielfach beschrieben, hergestellt und benutzt werden (z.B. 
Edwards et al., 1991) und z.T. als Kitldsung angeboten werden (z.B. SMART-cDNA library 
5 construction kit, Clontech), ist die Herstellung umfassender genomischer Bibliotheken 
ausgehend von geringen Mengen (<10 ng) von Erregernukleins&uren bisher nicht beschrieben 
Daher war es notwendig fur das erfindungsgemasse Verfahren ein DNA- 
Amplifikationsmodul zu entwickeln, welche die Herstellung von umfassenden genomischen 
Expressionsbanken aus Subnanogrammengen Material erlaubt. Die Methode wurde fur das 

10 Vacciniavirusgenom etabliert und ist ohne Modifikationen fur alle DNA-kodierten Erreger 
und mit geringen Modifikationen auf RNA kodierte Pathogene ubertragbar. Die 
Amplifikation der Vacciniavirus-DNA wurde durch eine Klenow-Enzym Reaktion 
eingeleitet, fur die Adaptor-Oligonukleotide mit degeneriertem 3-Ende fur ein 
sequenzunabh&ngiges Priming nach dem Random-Prinzip verwendet wurden. Hierauf folgen 

15 sequentiell zwei PCR-Amplifikationen mit Oligonukleotiden, die der Adaptorsequenz 
entsprechen. In einer Reihe von unabhangig durchgefiihrten Experimenten sind die 
Bedingungen fur eine besonders effiziente Amplifikation erarbeitet worden. Nach 
Optimierung der Methode wurden zur Bestimmung der Sensitivitat verschiedene Mengen 
Vaccinia- Virus DNA (u.a. 25 ng, 1 ng, 200 pg, 20 pg, 2 pg) mit 2 pMol Adaptor-N(6) 

20 (GATGT AAT ACGAA[P2] [P3 ] TTGG ACTC AT AT ANNNNNN) gemischt, 5 min bei 95°C 
denaturiert und anschlieBend auf Eis abgekuhlt. N steht hierbei fur den degenerierten 
Primeranteil. Nach Vorbereitung eines Reaktionsansatzes mit Klenow-Enzym (2 U), DNA- 
Polymerase-1 Puffer (10 mM Tris-HCl pH 7,5, 5 mM MgCl 2 , 7,5 mM Dithiothreitol, 1 nMol 
dNTPs) wurde eine Primerverlangerung bei 37°C fur 2 h durchgefuhrt. AnschlieBend erfolgte 

25 die Reinigung der durch Klenow-Polymerase elongierten Fragmente von den freien 
Adaptoroligonukleotiden uber Standardtechniken. Jeweils 1/25 (d.h. 1 ng, 40 pg, 8 pg, 0,8 pg, 
°» 08 Pg) der mit Klenow-Polymerase getaggten DNA wurden fiir einen ersten 
Amplifikationsschritt eingesetzt. Die PCR-Amplifikation mit Adaptor-Oligonukleotiden 
wurde mit zwei unterschiedlichen Oligonukleotiden (EcoRl-Adaptoroligonukleotid 

30 GATGT AAT ACGAATTCGACTCAT AT bzw. Mfel-Adaptor-Oligonukleotid 

GATGT AAT ACAATTGGACTCAT AT) (Anlagerung bei 60°C 1 min; Verlangerung bei 
72°C 2,5 min; Denaturierung 94°C lmin; 35 Zyklen) durchgefuhrt. Die einmalige 
Amplifikation der Nukleinsauren bei Nukleinsauren von weniger als 40 pg envies sich als 
nicht ausreichend um eine optisch im Ethidiumbromid/Agarosegel detektierbaren 

35 Amplifikationsschmier zu erzeugen. Je 1 \i\ des Amplifikats wurden daher anschlieBend als 
Template in eine zweite Amplifikation unter identischen Bedingungen fur 30-35 Zyklen 
uberfiihrt. Die amplifizierten Produkte wurden gelelektrophoretisch anaJysiert. Die 
beschriebenen PCR-Bedingungen fuhrten zu einer Amplifikation mit Fragmenten 
unterschiedlicher Lange (150-2000 bp) in alien Versuchsanordnungen bis minimal 0,8 pg 

40 Template DNA (Abb. 2A). Dabei wurden bei niedrigeren .Ausgangsmengen von DNA im 
Durchschnitt kurzere Fragmente amplifiziert. In verschiedenen Experimenten wurden die 
Bedingungen fur die Re-PCR variiert. Hierbei erwies sich das eine Variation der 
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Puflferbedingungen (z.B. Mg-Konzentration) und Variation der eingesetzten Enyzme z.B. 
Stoffel-Fragment der Taq-Polymerase unterschiedliche Amplifikationsmuster erzeugten (s. 
Abbildung 6). Fur die Reamplifikation werden ledigiich 1/50 der initialen PCR verwendet. 
Somit kann die Re-Amplifikation unter 50 verschiedenen Bedingungen durchgefuhrt werden. 
Das eine Variation der Amplifikationsbedingiingen eine besonders gute umfassende globale 
Amplifikation erlauben, wurde in der Reprfisentanz-Analyse im reversen Southern-Blot 
nachgewiesen (s. Abb. 6). Zur Uberpriifung der Identit&t amplifizierter Fragmente wurden 
diese uber Standardverfahren in den Bluescript Klonieningsvektor (Stratagene) ligiert und 
20 Klone wurden sequenziert. 20 von 20 Sequenzen stimmten mit Vacciniavirus-Sequenzen 
uberein, sodass eine Amplifikation von Artefakt-Sequenzen (z.B. polymerisierte 
Primersequenzen) ausgeschlossen werden konnte. 



Beispiel 3B; Herstellung einer genomischen Bibliothek 

Die Herstellung einer VacciniarBibliothek erfblgte durch Amplifikation von 20 pg einer mit 
Klenow-Polymerase getaggten Vaccinia DNA analog den im Beispiel 3A durchgefiihrten 
Bedingungen. Fur die PCR-Amplifikation mit Adaptor-Oligonukieotiden wurden in 
getrennten Ansatzen mit zwei unterschiedlichen Oligonukleotiden (EcoRl- 
Adaptoroligonukleotid GATGTAATACGAATTCGACTCATAT bzw. Mfel-Adaptor- 
Oligonukleotid GATGTAATACAATTGGACTCATAT) jeweils 1/50 der aufgereinigten 
Fragmente (Anlagerang bei 60°C 1 min; Verlfingerung bei 72°C 2,5 min; Denaturierung 94°C 
lmin; 35-40 Zyklen) verwendet. Je 1 ^1 des Amplifikats wurden anschliefiend als Template in 
eine zweite Amplifikation unter identischen Bedingungen fur 30 Zyklen uberfiihrt. Die 
amplifizierten Produkte wurden gelelektrophoretisch analysiert. Die beschriebenen PCR- 
Bedingungen fuhrten zu einer Amplifikation mit Fragmenten unterschiedlicher L&nge (200- 
2500bp) (Abb. 2B). Alle Kontrollreaktionen, in denen kein DNA-Template eingesetzt wurde, 
blieben negativ. AnschlieDend wurden die amplifizierten Produkte aufgereinigt, mit EcoRl- 
bzw. Mfel-Restriktionsenzymen verdaut und in Lambda-ZAP-Express-Vektor (EcoRl- 
Fragment, Stratagene) ligiert. Die Kombination zweier unabhangiger Restriktionsenzyme 
erhdht die Diversifikation und die Wahrscheinlichkeit, dass immundominante Bereiche nicht 
durch interne Restriktionsenzymschnittstellen zerstort werden und damit dem Nachweis 
entgehen. Nach Ligation der Nuldeinsaurefragmente in die Vektoren wurden diese nach 
Standardtechniken in Lambda-Phagen verpackt. Dies erfblgte mit kommerziell erwerblichen 
Packaging Extrakten entsprechend den Herstellerangaben (z.B. Gigapack Gold m, 
Stratagene). Die so entstandenen Lambdaphagen-Bibliotheken (SE mit EcoRI-Adaptoren, SM 
fiir Mfel-Adaptoren) wurden ohne weitere Amplifikation im Immunoscreening analysiert. 
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Beisoiel 4 

Immunoscreening und Identifikation von Antigenen 

Das Immunoscreening wurde wie bereits in Sahin et ai. (1995), Proc Natl Acad Sci USA 92: 
11810-3; und Tttreci et ai. (1997), MolMed Today 3, 342-349 beschrieben durchgefiihrt. 

5 Bakterien des ELcoli K12-abgeleiteten Stammes XL1 MRF wurden in der exponentiellen 
Wachstumsphase geerntet, auf eine OD6oo=0,5 eingestellt und mit den Lambdaphagen der 
beschriebenen Expressionsbank infiziert. Die Anzahl der Plaque-bildenden Einheiten (plaque- 
forming-units, pfii) wurde derart eingestellt, dass eine Subkonfluenz der Plaques vorlag (z.B. 
-5000 pfii/ 145 mm Petrischale). Unter Zusatz von TOP- Agar und IPTG wurde der 
10 Infektionsansatz auf Agarplatten mit Tetrazyklin ausplattiert. Bei der Ubernachtkultur bei 
37°C bildeten sich auf dem Bakterienrasen Phagenplaques. Jeder einzelne Plaque 
reprasentiert einen Lambda-Phagen-Klon mit der in diesen Klon inserierten Nukleinsaure und 
enthalt gleichzeitig das von der Nukleinsaure kodierte rekombinant exprimierte Protein. 

Nitrozellulosemembranen (Schleicher & Schull) wurden aufgelegt, um Abklatschpr&parate 
15 der rekombinanten Proteine herzustellen (Plaque Lift). Nach Waschschritten in TBS-Tween 
und Blocken unspezifischer Bindungsstellen in TBS + 10% Milchpulver erfolgte die 
Inkubation im Serum des infizierten Wirtes iiber Nacht. Es wurde zu diesem Zweck gepooltes 
Serum der Infektionstage 16 und 30 verwendet und 1:100.-1: 1.000 verdunnt. Nach weiteren 
Waschschritten . wurden die Nitrozellulose-Membranen mit einem gegen Maus-IgG 
20 gerichteten, sekundaren AP-konjugierten Antikorper inkubiert. Bindungen von 
Serumantikorpern an in Phagenplaques rekombinant exprimierte Proteine konnten auf diese 
Weise durch eine Farbreaktion sichtbar gemacht werden. Klone, die als reaktiv mit Wirtsseren 
identifiziert wurden, konnten auf die Kulturplatte zuriickverfolgt und von dort das 
entsprechende Phagenkonstrukt monoklonal isoliert werden. Nach erneuter Ausplattierung 
25 wurden solche positiven Klone bestatigt. Durch in vivo Exzision wurde der 
Lambdaphagenklon zum Phagemid rezirkularisiert (Sahin et al. (1995), Proc Natl Acad Sci 
USA 92: 11810-3). 

In beiden Banken (SE und SM) wurden wie oben geschildert insgesamt 150.000 Klone 
gescreent. Zu diesem Zweck wurde das gepoolte Serum der infizierten Tiere vom Tag 16 und 
30 30 nach Infektion in einer Verdiinnung von 1:500 verwendet. Primar identifizierte Klone 
wurden zunachst oligoklonal unter Zunahme von benachbarten nicht-reaktiven Phagenplaques 
isoliert und nach Bestatigung monoklonalisiert (Abb. 3). Es konnten 26 (SE-Bank) bzw. 41 
(SM-Bank) Klone isoliert werden, die mit dem Serum der immunisierten Tiere reaktiv waren. 

Alle identifizierten Klone wurden zusatzlich mit Pr&immunseren von Mausen desselben 
35 Stammes getestet und waren nicht reaktiv. 
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Tabelle 2: Anzahl reaktiver Klone nach Screening der SE- und SM-Bank 



Bank gescreente Klone reaktive Klone 

Bank SE 150.000 26 — 

BankSM 150.000 41 



5 Die Sequenzierung und der Datenbankvergleich deckte unter anderem die drei folgenden 
unterschiedlich immunogenen Vacciniavirusproteine unter den Klonen auf: 



39 kDa immunodominant anti gen protein 

10 Drei Klone kodieren fur Bereiche aus dem 39-kDa Protein von Vacciniavirus (Abb. 4 A). Die 
Klone stellen Fragmente dieses Proteins dar. Sie beginnen alle bei Nukleotid 288, reichen 
aber unterschiedlich weit an das 3'-Ende dieses Genproduktes, namlich bis Nukleotid 688, 
788 bzw. 938. 

Das fur das 39-kDa Protein kodierende Gen ist der ORF A4L im Western Reserve (WR) 
15 Stamm (Maa und Esteban (1987), J. Virol 61, 3910-3919). Das 281 Aminosauren lange 39- 
kDa Protein ist in Menschen und Tieren stark immunogen (Demkovic et al. (1992), J. Virol. 
66, 386-398). 

Es wurde bereits beschrieben, dass eine Immunisierung mit dem 39-kDa Protein eine 
schiitzende Immunitat in Mftusen induzieren kann (Demkovic et al. (1992), J.Virol 66, 386- 
20 398). 

Die starkste antigene Domane scheint innerhalb der letzten C-terminal gelegenen 103 
Aminosauren zu liegen (Demkovic et al. (1992), J.Virol 66, 386-398). Die Lage der.hier 
gefundenen Fragmente ist ebenfalls als Hinweis auf Sero-Epitope zu verstehen. 
Interessanterweise decken die beiden stark immunreaktiven Klone 2 und 3 den Bereich dieser 
25 als stark antigen beschriebenen 103 Aminosauren ab. 

An diesem Beispiel wird auch die Multidimensionalitat der Aussagen des erfindungsgemaBen 
Verfahrens deutlich. Neben der Identifizierung des gleichzeitig auch Immunschutz 
gewahrenden Antigens ist durch die Anzahl uberlappender Klone ein Hinweis auf die 
Abundanz der Antikorper gegeben. Die Lage der Klone erlaubt eine Einengung der Sero- 
30 Epitope sowie die Starke der Reaktivitat einen Hinweis auf die Aviditat der AntikSrper. Dies 
gilt ebenso auch fur die im folgenden beschriebenen Antigene. 
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A-tvpe inclusion Protein ( ATI) 

Einige der hier gefiindenen Klone reprasentieren das A-type inclusion protein (ATI) (Abb. 
4B), ein ca. 160 kDa groBes Protein bei yerschiedenen Orthopoxviren (Patel et al. (1986), 
5 Virology 149, 174-189), das einen groBen Anteil der Proteinmenge der charakteristischen 
Einschlusskorperchen ausmacht. Beim Vacciniavirus ist dieses Protein trunkiert und nur ca. 
94 kDa groB (Amegadzie (1992), Virology 186, 777-782). ATI assoziiert spezifisch mit 
infektiosem intrazellularen reifen Vacciniapartikeln und ist nicht in behullten extrazellularen 
Vacciniaviren zu finden (Uleato et al. (1996), J. Virol. 70, 3372-3377). ATI ist eines der 
10 immundominanten Antigenen in M&usen, wobei die immundominanten Domanen am 
Carboxyterminus des Molekuls liegen (Amegadzie et al. (1992), Virology 186, 777-782). Die 
drei hier gefiindenen Klone, die identische Reaktionsstarken haben, decken den Bereich 
zwischen bp 308 und 1437 ab und sind entsprechend tatsachlich C-terminal bis zentral im 
kodierten Protein gelegen. 

15 

Plaque size/host range (ps/hr) Protein 

Das 38 oder 45 kDa groBe plaque size/host range Protein (ps/hr) wird durch den ORF B5R 
kodiert (Takahashi-Nishimaki et al. (1991), Virology 181, 158-164). ps/hr ist ein Typ 1 
Transmembranprotein, das in die Membran von extrazellularen Viruspartikeln inkorporiert 

20 wird oder von Zellen w&hrend der Infektion sezerniert werden kann. Antikorper gegen ps/hr 
neutralisieren die Infektiositat des Vacciniavirus (Galmiche et al. (1999), Virology 254, 71- 
80). Deletion von ps/hr fuhrt zur Attenuierung des Virus in vivo (Stern et al. (1997), Virology 
233 , 118-129). Ausserdem schiitzt die Immunisierung mit B5R gegen eine Infektion mit 
ansonsten todlichen Dosen des Virus (Galmiche et al. (1999), Virology 254, 71-80). Drei der 

25 hier identifizierten Klone stellen Fragmente dar, die wiederum denselben Bereich dieses 
Antigens abdecken und den C-Terminus einschliefien (Abb. 4C). Dies bedeutet, dass das von 
diesen Klonen reprasentierte Sero-Epitop im extrazellularen Bereich dieses viralen 
Oberflachenmolekuls liegt und somit gut fiir Antik6rper zuganglich ist. 

30 Beispiel S 

Seauenzierung und bioinformatische Analyse der identifizierten Vacciniavirusantigene 

r 

Die Sequenzierung der identifizierten Klone erfolgte nach Standardtechniken mit 
Oligonukleotiden, die das Insert flankieren (BK-Reverse, BK-Universe) in Sanger'schen 
Kettenabbruchverfahren. Ermittelte Sequenzen wurden uber BLAST-Analyse mit bekannten 
35 Sequenzen in der Genbank abgeglichen. Die Lokalisation der Vacciniavirusantigene im 
Genom (Accessionsnummer M35027) und die Standardnomenklatur ist in Tabelle 3 
angegeben. Diese Analyse zeigt, dass uber das gesamte Vacciniavirusgenom verteilte 
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Antigene mit dem erfindungsgemassen Verfahren identifiziert wurden. Bei einer 
grossen Anzahl der identifizierten Gene ist bisher nicht bekannt gewesen, dass die 
Genprodukte eine Wirkung als Antigen besitzen. Mit Hilfe des erfindungsgemassen 
Verfahrens werden daher nicht nur bekannte Antigene, sondern auch unbekannte Antigene 
5 identifiziert. Ein weiterer Vorteil des erfindungsgemassen Verfahrens ist, dass Antigene 
identifiziert werden kdnnen, die auf beiden Strangen (kodierender und komplementarer 
Strang) des Genoms zu finden sind. 



10 

Tabelle 3: Identitat, genomische Lokalisation, serologische Reaktivitat und Anzahl der 
identifizierten Vacciniavirusantigene mit Hilfe des erfindungsgemassen Verfahrens. 

Vacciniavims Antigene Lokalisation in W-Genom SEQ ID NO: Signal # Klone 



39 kDa immunodominant antigenic antigen 
(A4L) 


ORF 151 (117270-116425) 


4 


Mil 


62 


94 kDa A-type inclusion protein (TA31L) 


ORF 174 (138014-135837) 


5 


+++ 


30 


35 kDa plaque size/host range protein 
(B5R) 


ORF 232 (167383-168336) 


6 


+++ 


7 


1 16 kDa DNA polymerase (E9L) 


ORF 80 (59787-56767) 


7 


+++ 


4 


65 kDa envelope protein (F12L) 


ORF 60 (43919-42012) 


8 


+++ 


2 


62 kDa rifampicin resistence gene (D13L) 


ORF 145 (113026-111371) 


9 


+++ 


1 


32 kDa carbonic anhydrase-like protein 
(D8L) 


ORF 137 (107120-106206) 


10 


+++ 


1 


36 kDa late protein (I1L) 


ORF 87 (63935-62997) 


11 


+++ 


1 


16 kDa protein (TC14L) 


ORF10 (10995-10567) 


12 


+++ 


1 


38 kDa serine protease inhibitor 2 (B13R) 


ORF 421 (172562-172912 


13 


++ 


4 


18 kDa protein (C7L) 


ORF 24 (19257-18805) 


14 


++ 


3 


24.6 kDa protein (B2R) 


ORF 226 (163876-164535) 


15 


++ 


2 


36 kDa protein (A11R) 


ORF 164 (124976-125932) 


16 


++ 


1 


15 kDa membrane phosphoprotein (A14L) 


ORF 167 (126785-127128) 


17 


++ 


1 


147 kDa protein (J6R) 


ORF 117 (86510-90370) 


18 


++ 


1 


77 kDa protein (OIL)) 


ORF 84 (62477-60477) 


19 


++ 


1 


59 kDa protein (C2L) 


ORF30 (24156-22618) 


20 


+ 


4 
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90 kDa protein (D5R) ORF132 (101420-103777) 21 + 1 

23 kDa protein (A17L) ORF170 (129314-128703) 22 + 1 



In der Abbildung 5 ist eine grafische Representation des Vacciniavirusgenoms mit 
Darstellung der oflFenen Leseraster (ORF) zu finden, die zeigt, dass die durch das 
erfindungsgemasse Verfahren identifizierten Antigene ttber das gesamte Vacciniavirusgenom 
5 verteilt sind. Dies indiziert, dass das erfindungsgemasse Verfahren eine representative 
Amplifikation von spezifischer Erregernukleinsaure aus geringsten Mengen von 
Ausgangsmaterial (1-20 pg) erlaubt. 

Beisoiel 6 

10 Reprasentationsanalvse durch reversen Southern Blot 

Die representative Amplifikation aus geringsten Mengen von Erregernukleinsauren durch das 
erfindungsgemasse Verfahren wurde ebenfalls im folgenden Experiment gezeigt. 

Zehn Genabschnitte des Vacciniavirusgenoms wurden ausgewahlt und durch PCR- 
Reaktionen amplifiziert. Nach gelelektrophoretischer Auftrennung wurden die DNA- 

15 Fragmente fiber alkalischen Transfer auf Nylonmembranen geblottet. Radioaktive 
Hybridisierung wurde mit 20 ng nach dem erfindungsgemassen Verfahren hergestellter und 
mit 32 P markierter DNA durchgefuhrt. Abb. 6A zeigt, dass nur ein Teil der zehn zufallig 
ausgewahlten Abschnitte des Genoms in der nach dem erfindungsgemassen Verfahren 
hergestellten DNA in einer einzelnen Re-PCR DNA enthalten sind. Werden mehrere Re-PCR 

20 DNA, die in unterschiedlichen Ansatzen und unter variierten Bedingungen hergestellt 
wurden, kombiniert, ist die 100%ige Reprasentanz der zufallig ausgewahlten Genabschnitte in 
der nach dem erfindungsgemassen Verfahren hergestellten DNA offensichtlich (Abb. 6B). 
Die unterschiedliche Abundanz der Nukleinsauren, z.B. des 39 kDa Antigens (Abb. 6B, Spur 
10), kann zumindest teilweise erkleren, dass bestimmte Genabschnitte haufiger in der nach 

25 dem erfindungsgemassen Verfahren hergestellten DNA gefiinden werden. Eine niedrige 
Abundanz der DNA im Ampiifikat schliesst aber eine haufige Detektion im Screening nicht 
aus, wie das Beispiel der A-type inclusion protein DNA (Abb. 6B Spur 2) zeigt. 

Beisoiel 7 

DiffTerentielle Seroloeie 

30 Lambdaphagen, deren rekombinante Inserts fur Antigene kodierten, die durch Antikorper im 
Serum infizierter Mause erkannt werden, wurden auf Reaktivitat mit Seren nicht infizierter 
Tiere (immunologisch naiv) und mit Seren von mit dem Lymphocytaren 
Choriomeningitisvius infizierten Mausen getestet. Diese Studien wurden ebenfalls als Plaque- 
Lift Assay durchgefuhrt. Der Antikdrpertiter und die spezifische Reaktivitat der Seren gegen 
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Lift Assay durchgefuhrt. Der Antikorpertiter und die spezifische Reaktivitfit der Seren 
gegen die klonieiten Antigene kann so einfach ermittelt werden. In Abb. 7A ist dargestellt, 
wie die Reaktivit&t eines am Tag 21 nach Infektion mit dem Vacciniavirus gewonnenen 
Serum gegen das 39 kDa Antigen ermittelt wurde. Zweifache Serumverdunnungen wurden 
5 mit durch Phagen in E. coli induziertes, rekombinantes 39 kDa Antigen inkubiert. Eine 
spezifische Reaktivit&t ist bei einer SeromverdOnnung von 1:16000 noch erkennbar. Der 
zeitliche Veriauf der Antikorperreaktivit&t gegen das 39 kDa Antigen in mit Vacciniavirus 
infizierten, Lymphocytfiren Choriomeningitisvinis infizierten und in nicht infizierten Mausen 
ist in Abb. 7B dargestellt. Der Veriauf der Antikdrperantwort nach Vacciniavirusinfektion ist 
10 fur diese Infektion typisch. Das Fehlen einer Reaktivit&t gegen das 39 kDa Antigen in naiven 
Mausen und die nur sehr geringe Kreuzreaktivit&t nach Infektion mit dem LymphocytSren 
Choriomeningitisvirus zeigt die gute diagnostische Qualitat, die "mit durch das 
erfindungsgemasse Verfahren identifizierten Antigenen erreicht werden kann. 

Beispiel 8 

15 Identifikation von bakteriellen Antigenen mit Hilfe des erfindungspemSBen Verfahrens 

Zun&chst wurden die Bedingungen erarbeitet, die eine Anreicherung von bakteriellen 
Erregern aus infizierten Proben erlauben. Hierzu wurde der Umstand genutzt, dass 
Bakterienwande widerstandsfahig gegenuber einer Lyse mit Solventien wie z.B. SDS sind. 
Durch eine SDS-Konzentrationsreihe wurde die Stabilit&t vom gramnegativen, grampositiven 

20 Bakterien und eukaryontischen Zellen bestimmt. Wie in Abbildung 8 dargestellt bleibt unter 
1% SDS die korpuskulare Struktur grampositiver Bakterien erhalten. Gramnegative Bakterien 
wie in diesem Beispiel E. Coli weisen immerhin eine Widerstandsfahigkeit gegen Lyse bis 
auf 0,1% SDS auf. Dagegen werden alle Membranstrukturen (Zytoplasma, Kern) von 
eukaryontischen Zellen, wie in diesem Fall Fibroblasten, vollstandig aufgelost. Die hohe 

25 SDS-Sensitivitat von eukaryontischen Zellen wurden in anderen Beispielen auch fur 
Leukozyten, Milzzellen, Lymphknotenbiopsien verifiaert. Nach Erarbeitung der 
Bedingungen wurde das erfindungsgemasse Verfahren fiir einen bisher nur unzureichend 
charakterisierten Erreger, Tropheryma whippelii, durchgefuhrt. Tropheiyma whippelii ist ein 
gram-positives Bakterium und die Infektion mit diesem Erreger kann die Whipplesche 

30 Erkrankung auslosen. Die Whipplesche Erkrankung ist eine chronische Infektion 
verschiedener Organe mit der Hauptmanifestation im Daxm, die unerkannt zum Tode fuhren 
kann. Dieser Erreger ist nur schwer in vitro anzuchtbar, so dass fur molekulare Analysen nur 
geringste Mengen an spezifischer Nukleinsaure zur Verfugung stehen. Aufgrund dieser 
Probleme war die Analyse der antigenen Strukturen dieses Erregers bisher nicht moglich. 

35 Durch das erfindungsgemasse Verfahren gelang es, potentielle Antigene dieses Erregers zu 
definieren. In der Abb 9 sind die wesentlichen Schritte, die zur Charakterisierung von 
Tropheryma whippelii spezifischen Antigenen gefuhrt haben, dargestellt. 

T. whippelii haltiges, homogenisiertes Gehirnmaterial eines an der Whippleschen Erkrankung 
verstorbenen Patienten wurde verwendet, um mit Interleukin-10 und Interleukin-4 
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deaktivierte Makrophagen zu inokulieren (Schoedon et al. (1997) J Infect Dis. 176:672- 
677). Am Tag 7 postokulationem wurden infizierte Makrophagen geerntet. und 25 \xl des 
Makrophagen/Bakterien Gemischs wurden verarbeitet. Die differenzielle Zellyse erfolgte 
durch Inkubation der mit Bakterien infizierten Makrophagen in 1% SDS enhaltendem 
5 Proteinase K Puffer ftir 15 min mit 20 ng/ml Proteinase K bei 55°C. Durch diese Behandlung 
wurden die in der Mischung vorhandenen Makrophagen (eukaryontische Zellen) aufgelost. 
Durch die Lyse der Makrophagen werden deren Nukleinsauren (RNA, DNA) in die Losung 
freigesetzt. Dagegen verbleiben die Nukleinsauren der Bakterien durch Erhaltung der 
Integrity der grampositiven Bakterienwand in den Bakterienzellen. Nach der Inkubation mit 

10 SDS/Proteinase K wurden die Bakterien durch Zentrifugation der Suspension pelletiert. 
Dagegen liessen sich die Bakterien bei fehlendem Zusatz von Proteinase K aufgrund hoher 
Viskositat der Losung schlechter pelletieren. Der Uberstand mit den Nukleinsauren der 
Makrophagen wurde verworfen und das kaum sichtbare Pellet mehrfach gewaschen. Nach 
den Waschschritten wurden pelletierte Bakterien in 100 \il Wasser resuspendiert und jeweis 

15 10 p.1 der Suspension lichtmikroskopisch und nach Farbung mit dem DNA-FarbstofF D API in 
der Immunfluoreszens zur Bestimmung der Bakterienzahl verwendet. Die Anzahl der aus 25 
|il der infizierten Makrophagen isolierten Bakterien betrug nach mikroskopischer Auszahlung 
ca. 4000-6000 DNA-haltige Partikel. Die residualen 80 jil angereicherten Bakterien wurden 
zur Gewinnung von bakteriellen Nukleinsauren nach Standardtechniken (Kochen, 

20 Denaturierung, DNA-Isolation mit Phenol/Chloform) weiterverarbeitet. Die Menge der aus 
den Bakterien isolierten DNA konnte aufgrund der niedrigen Menge nicht experimentell 
quantifiziert werden (kein detektierbares Signal im EtBr-Gel). Aufgrund der licht- und 
immunfluoreszensmikroskopisch ermittelten Bakterienzahl (max. 6000) wurde bei einer 
angenommenen Bakteriengenomgrosse von 1-2 Mio Basen doppelstrangige DNA eine 

25 maximalen Ausbeute von 6-12 pg Erreger-DNA kalkuliert (Fur die Kalkulation wurde das 
Durchschnittsgewicht eines Nukleotids von 660 eingesetzt). 50% der extrahierten DNA (d.h. 
max. 3-6 pg) wurde wie nach dem erfindungsgemassen Verfahren beschrieben (Klenow, 
sequentielle PCR, Re-PCR) amplifiziert und aus den amplifizierten Fragmenten eine 
genomische Bibliothek in Lambda-ZAP-Express-Vektor (Stratagene) hergestellt. Das 

30 Immunoscreening wurde mit Seren von T. whippelii infizierten Patienten durchgefuhrt. 
Positive Klone wurden sequenziert und bioinformatisch analysiert. Als Beispiel ist in Abb. 8 
ein Klon aufgeftihrt, der sowohl fur ein bakterielles putatives Lipoprotein als auch fur ein 
putatives Histidine triad protein kodiert. 

Dieses Beispiel zeigt, dass das erfindungsgemasse Verfahren neben der Identifikation von 
35 viralen Antigenen auch geeignet ist, bakterielle Antigene zu identifizieren. 

Beispiel 9: Anreicherung von Whipple Bakterien aus einer infizierten Milzprobe eines 
Patienten mit systemischer Infektion. 

Jeweils 20 \x\ einer kryopraservierten Milzprobe eines Patienten mit Morbus Whipple wurden 
40 unter fiinf leicht modifizierten Bedingungen zur Anreicherung von Bakterien verwendet 
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(insgesamt 100 Hierzu wurden die Milzproben wie im Beispiel 8 beschrieben in 

1,5 ml Proteinase K Puffer mit 20 mg/ml Proteinase K Zusatz 10-60 min bei 55°C inkubiert. 
Danach wurden die in den infizierten Milzprobe befindlichen Bakterien wie im obigen 
Beispiel beschrieben durch Zentrifugation angereichert und mikroskopisch wie vorher 
5 beschrieben dokumentiert. Abbildung 10 zeigt eine Aufhahme einer bakterienreichen 
Pelletfraktion. Anschliessend wurden die Bakterien durch Kochen in GITC-PufFer und 
Ultraschallbehandlung aufgeschlossen und die bakteriellen Nukleinsauren uber 
Standardverfahren isoliert. Wie erwartet, war die Menge der Nukleinsauren, die aus den 
angereicherten Fraktionen isoliert wurden, unter der Nachweisgrenze von 1 ng. Zur 

10 Dokumentation der bakteriellen Anreicherung wurden jeweils 1/100 der isolierten 
Nukleinsauren fiir eine PCR-Ampflifikation mit Whipple-Bakterien (Sequenz noch einfbgen) 
bzw. human-DNA (Sequenz noch einfugen) spezifischen Oligonukleotiden eingesetzt und 
uber 37 Zyklen amplifiziert. Abbildung 11A zeigt die Amplifikations-Resultate (A: PCR 
spezifisch fur Whipple Bakterien, B: PGR spezifisch fur humane DNA). Die Ergebnisse sind 

15 dargestellt fur Amplifikationsbanden der Bakterien-angereicherten Fraktionen (Spur 1-3) 
bzw. von aus der nicht-angereicherten Fraktionen (Spur 4-6). Wahrend in den nicht- 
angereicherten Fraktionen wie erwartet die Amplifikationssignale fiir humane DNA deutlich 
starker sind (Spur 4-6) zeigen besonders Fraktionen 1 und 2 fast ausschliesslich eine 
Amplfikation von Erregernukleinsauren. Das Beispiel zeigt das die geringe Menge des 

20 bendtigten Materials es ermoglicht, die Anreicherungsbedingungen leicht zu variieren und 
anschliessend mit der am starksten angereicherten Erreger-Fraktion (in diesem Fall 1 und 2) 
das erfindungsgemasse Verfahren fortzusetzen. 



Beispiel 10: Giobale Amplifikation von Erregernukleinsauren aus direkt aus einer Milzprobe 
25 isolierten DNA. Die nach dem erfindungsgem&ssen Verfahren wie im Beispiel 9 dargestellt 
isolierten Erregernukleinsauren wurden wie im Beispiel 3 beschrieben amplifiziert und aus 
den amplifizierten Fragmenten eine genomische Bibliothek in Lambda-ZAP-Express-Vektor 
(Stratagene) hergestellt. Das Immunoscreening wurde mit Seren von T. whippelii infizierten 
Patienten durchgefuhrt. Positive Klone wurden sequenziert und bioinformatisch analysiert 

30 
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PATENTANSPRUCHE 

1 . Verfahren zur Identifizierung von durch das Genom von mikrobiellen Erregem 
5 kodierten biologisch aktiven Strukturen ausgehend von genomischen Erregernukleinsauren, 

umfassend die Schritte 

(a) Gewinnung von genomischen Erregernukleinsauren aus erregerhaltigen 
Proben, . / _ 

(b) Sequenzunabhangige Amplifikation von genomischen 
10 Erregernukleins&uren, 

(c) Expression amplifizierter Erregernukleinsauren, und 

(d) Screening und Identifizierung der biologisch aktiven Struktur. 

2. Verfahren gemaB Anspruch 1, dadurch gekennzeichnet, dass die durch das 
15 Genom von mikrobiellen Erregern kodierten biologisch aktiven Strukturen durch das Genom 

eines bakteriellen Erregers kodiert werden. 



3. Verfahren gemaB Anspruch 1, dadurch gekennzeichnet, dass die durch das 
Genom von mikrobiellen Erregern kodierten biologisch aktiven Strukturen durch das Genom 
20 eines DNA-haltigen Virus kodiert werden. 



25 



4. Ein Verfahren gem&ss Anspruch 1-3, wobei der mikrobielle Erreger ein 
intrazellularer viraler oder bakterieller Erreger ist. 



5. Ein Verfahren gemass Anspruch 1-3, wobei der mikrobielle Erreger ein 
extrazellul&rer viraler oder bakterieller Erreger ist. 



6. Ein Verfahren gemass den Anspriichen 1-3, wobei der mikrobielle Erreger 
30 nicht-vital und/oder nicht-infektios ist. 

7. Ein Verfahren gem&B Anspruch 1, wobei die biologisch aktive Struktur ein 
Erregerantigen ist. 
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8. Ein Verfahren gemaB Anspruch 1, wobei die biologisch aktive Struktur ein 
Pathogenitatsfaktor des mikrobiellen Erregers ist. 



9. Ein Verfahren gemaB Anspruch 1, wobei die biologisch aktive Struktur ein 
5 enzymatisch aktives Protein ist. 



10. Ein Verfahren gemass Anspruch 1, wobei zur Identifikation 10-20 pg 
Erregernukieinsaure verwendet werden. 

10 11. Ein Verfahren gemass Anspruch 1, wobei zur Identifikation 1-10 pg 

Erregernukieinsaure verwendet werden. 



12. Ein Verfahren gemass Anspruch 1, wobei die Proben Blut, Gewebe, kultivierte 
Zellen, Serum, Sekret aus LSsionen und andere Kdrperflussigkeiten umfassen. 

15 

13. Ein Verfahren gemass Anspruch 1^ wobei die Gewinnung von genomischen 
Erregernukleins&uren aus erregerhalttgen Proben in Schritt (a) die folgenden Schritte umfasst: 

(ai) Freisetzung von Erregerpartikeln aus erregerhaltigen Proben 

optional fo) Elimination und/oder Reduktion kontaminierender 
20 Wirtsnukleins&uren 

und (a3) Extraktion der genomischen Erregernukieinsaure aus freigesetzten 
Erregerpartikeln. 



14. Ein Verfahren gemass Anspruch 13, wobei die Freisetzung von 
25 Erregerpartikeln in Schritt (ai) durch Zeilyse, Sedimentation, Zentrifugation und/oder 
Filtration erfolgt. 



15. Ein Verfahren gemass Anspruch 13, wobei die Elimination und/oder Reduktion 
kontaminierender Wirtsnukleinsauren in Schritt (a*) durch RNase- und/oder DNase-Verdau 
30 erfolgt. 



16. Ein Verfahren gemass Anspruch 13, wobei die Extraktion der genomischen 
Erregernukieinsaure in Schritt (a3> durch Abtrennung des genetischen Materials des Erregers 
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von korpuskularen Bestandteilen des Erregers durch Proteinase K-Verdau, Denaturierung, 
Lysozym-Behandlung oder organische Extraktion erfolgt. 

17. Ein Verfahren gem&ss Anspruch 1, wobei die sequenzunabhangige 
5 Amplifikation der genomischen Erregernukleinsaure in Schritt (b) durch Klenowreaktion mit 

Adaptoroligonukleotiden mit degeneriertem 3'-Ende und nachfolgender PCR mit 
Oligonukleotiden, die der Adaptorsequenz entsprechen, erfolgt. 

18. Ein Verfahren gemass Anspmch 1, wobei die Amplifikation der 
10 Erregernukleinsaure in Schritt (b) durch reverse Transkription mit degenerierten 

Oligonukleotiden und nachfolgender Amplifikation durch PCR erfolgt. 

1 9. Ein Verfahren gemass Anspruch 1 , wobei die Amplifikation der 
Erregernukleinsaure in Schritt (b) durch reverse Transkription mit degenerierten 

1 5 Oligonukleotiden und nachfolgende Amplifikation mit T7 RNA Polymerase erfolgt. 

20. Ein Verfahren gemass Anspruch 1, wobei zur Expression von amplifizierten 
Erregernukleinsauren in Schritt (c) ein Einbringen der Erregernukleinsauren in Vektoren und 
Verpackung der Vektoren in Lambda-Phagen erfolgt. 

20 

21. Ein Verfahren gemass Anspruch 1, wobei zur Expression von amplifizierten 
Erregernukleinsauren in Schritt (c) ein Einbringen der Erregernukleinsauren in filamentose 
Phagen- Vektoren erfolgt. 

25 22. Ein Verfahren gemass den Anspriichen 20 und 21, wobei die Vektoren 

ausgewahlt sind aus der Gruppe der viralen, eukaryotischen oder prokaryotischen Vektoren. 

23. Ein Verfahren gemass Anspruch 1, wobei das Screening ein Immunoscreening 
auf Erregerantigene darstellt und die Identifizierung von Erregerantigenen in Schritt (d) die 
30 foigenden Schritte umfasst: 

(di) Infektion von Bakterien mit Lambda-Phagen, 

(d 2 ) Kultivierung der infizierten Bakterien unter Bildung von Phagenplaques, 
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(d3> Transfer der Phagenplaques auf eine 

Nitrozellulosemembran oder einer anderen Festphase, die zur Immobilisierung 
von rekombinanten aus den Erregern abgeieiteten Proteinen geeignet ist, 
(cU) Inkubation der Membran mit Serum oder antikdrperhaltigen 
5 Korperflussigkeiten des infizierten Wirtes, 

(d$) Waschen der Membran, 

(d*) Inkubation der Membran mit sekundarem AP-gekoppeltem anti-IgG- 
Antikdrper der spezifisch fiir Immunglobuline des infizierten Wirtes ist. 

(d?) Nachweis der mit Wirtsserum reaktiven Klone durch Farbreaktion, und 
10 (dg) Isolierung und Sequenzierung der reaktiven Klone. 

24. Ein Verfahren gemass Anspruch 1, wobei das Screening ein Immuno screening 
auf Erregerantigene darstellt und die Identifizierung von Erregerantigenen in Schritt (d) die 
folgenden Schritte umfasst: 

(di) Generierung von rekombinanten filamentosen Phagen durch Einbringen 
der filamentosen Phagenvektoren in Bakterien, 

(d 2 ) Inkubation generierter rekombinanter filamentSser Phagen mit Serum 
eines infizierten Wirtes, 

(d 3 ) Selektion der filamentosen Phagen, an die Immunglobuline des Wirts 
gebunden haben, uber immobilisierte Reagentien die spezifisch fur die 
Immunglobuline des infizierten Wilts sind, und 

(d*) Isolierung und Sequenzierung der selektierten Klone. 

25. Ein Verfahren gemass Anspruch 1, wobei der mikrobielle Erreger vor Gewinnung 
der Nukleinsauren durch F&llung mit Polyethylenglykol, Ultrazentrifugation, 
Gradientenzentrifiigation oder durch Affinitatschromatographie angereichert wird. 

26. Vaccinavirusantigen, dadurch gekennzeichnet, dass das Antigen von einer 
Nukleinsaure codiert wird, die 80% Homologie zu einer der Sequenzen SEQ ID 
NOS: 4,5,6,7,8,9,10, 11,12, 13, 14, 15, 16 ,17, 18 ,19, 20, 21 oder 22 aufweist. 

27. Vaccinavirusantigen nach Anspruch 26, dadurch gekennzeichnet, dass das Antigen 
von einer Nukleinsaure codiert wird, die 90% Homologie zu einer der Sequenzen 
SEQ ID NOS: 4,5,6,7,8,9,10, .11,12, 13, 14, 15, 16 ,17, 18 ,19, 20, 21 oder 22 
aufweist. 

28. Vaccinavirusantigen nach Anspruch 26, dadurch gekennzeichnet, dass das Antigen 
von einer Nukleinsaure codiert wird, die 95% Homologie zu einer der Sequenzen 
SEQ ID NOS: 4,5,6,7,8,9,10, 11,12, 13, 14, 15, 16 ,17, 18 ,19, 20, 21 oder 22 
aufweist. 
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29. Vaccinavirusantigen nach Anspruch 26, dadurch 

gekennzeichnet, dass das Antigen von einer der NukleinsSuren SEQ ID NOS: 
4,5,6,7,8,9,10, 11,12, 13, 14, 15, 16,17, 18,19, 20, 21oder22 codiert wird. 
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Abbildung 2 B 
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Vacciniavinis Antigene Lokalisation in W-Genom Signal # 

Kl 
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39 kDa immunodominant antigenic antigen ORF 151 (117270-116425) i i H 62 
(A4L) 

ttacrtmggaatcgttcaaaacc^gactagttgtagaamgat^ 
atcgmgmcggccrtgaagttggtgcatatcttmcaacacte^ 

ctcctggamggatmgttgtgctgttgtacatactgtaccaccagtaggtgtaggagtacatacagt^ 

ggtgtaaccgttggagtagtacaagaaatamccatccgattgttgtgtacatgtagttgtt^ 

cggcgtcgtcgttttttgatcmattaaamagagataatatcrt^ 

gcgcatragtatcttcagacagccaatcaaaaagattagacatatc^ 

tactaggtagaagaataggagccggtgtagctgttggaaccggrtgtggagttatatgaatagtt 

gctggcggccatcatattatctctagctagttgtt 

tfttttcgtatccggatccttttcttragaataatagattgacgac^ 

tccat 

94 kDa A-type inclusion protein (TA3 1L) ORF 174 (138014-135837) +++ 30 
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crtaagacgtcgcatctctctctgmcggcattgg^ 

ctgctaattfctgtagratmcacggcattcactcagtt^ 

accgctctcgatgc^cggtcaacttattrtetagttctctaatacgcgaacgcagtgca^ 

acattcatcgagtctagattcgagatrtc^cgcgtcgtc^ 

tamagcaamctgatttfagagtatfgatmgcttacgtagta^ 

tgatatccctacgaagtctggacagttccrattcgacato^ 

tacgactgagttcaagttctcgttgacaagatccat^ 

cctatcaagcgattcrtctcaattctcggatagtcttcttatcaam 

tgatctctmgtaagtcggtcgattc^cggttttataaacagaatc 

aattcggtgagtmc^rttggcttcttccaactctgttttaaactctccactamcc^ 

taataactagttggtaatcagcgattcctatagccgttcttgtaattgtgggaaca 

tcatcmatcattattagggggatggacaaccttaattggtt^ 

aggcttaggcaaatgcttgtcgtacgcgggcacttc^catccatcaagtatttataatcgggtt 

gcgacttcgggagttagtagaagaacrtctgmcrtgtatctatcaac^^ 

atcatccgtatcttctgaaacaccatcatatgacamcatgaagtc^^ 

ccttmagtaaacgcatatgtatatmagatctccagamcat^ 

cactaatgggtgatgaaaaagataccggaccatatgctacgttgataaataart 

gaggaaatattc^gtatataggtatgtcttggcgtcatatcttgtactaaacacgctaaaca 

ttagagcagcaggaataccaacaaacatattaccacatccgtatmctatgaatatcacatatcatgttaaaaaatm 

aatatctcgtctgacttaatgagtcgtagttcagcagcaacataagtcataactgtaaatagaa^ 

ccgcatcaacaccattattaaaaatagttttatatacatctttaatctgctctccgttaatcgtcgaacgttc^ 

tcttatctgtagttaatgacttagjgatatcacgaagaatattacgaattacam 

gttccatagttmctocctcagtggcgaaatcmggagtgctt^ 

35 kDa plaque size/host range protein (B5R) ORF 232 (167383-168336) HH-+ 7 



Atgaaaacgamccgttgttacgttgttatgcgtartacctgagttgtttattcaacatgtactgtaccc^ 
gtcUccgaaacatcgmaataataaccagaaagttacgm^ 

agataaatggaaatacgaaaatccatgcaaaaaaatgtgcacagmctgattacatctctgaactatataataaacc^ 

aattccaccatgacactaagttgc^cggcgaaacaaaataffltcgttgcgaagaaaaaaatggaaatacttctt 

gtgtcctaatgcggaatgtcaacctcttcaattagaacacggatcgtgtcaaccagtt 

tcaactgtgatgttggatatgaggttattggtgcttcgtacataagttgtacagctaattcttggaatgttatt 

gatataccgtctctatctaatgganaamcxggataacatmctatcggtggcgttatacatc^ 

gatctccatcata^catgtatcgacggtaaatggaatcccgtartcccaatatg^ 

tggtcccgacgatgagacagamgagcaaactctcgaaagacgttgtacaatatgaacaagaaatagaa^ 

tataatcatagtggcgttaacaattatgggcgtcatattmaatctccgttatagtattagmgttc^ 

gttccataaattgctaccgtaa 

1 1 6 kDa DNA polymerase (E9L) ORF 80 (59787-56767) -H-h 4 
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ttatgcttcgtaaaatgtaggtmgaaccaaaca^ 

tcaatcgmaaagtaaacttcgtaaaatattcmgatc^c^gcxgagtttaaaacttctatcgataatt 

tmggtccatggtarattagccggacaaatatatgcaaaataate^ 

caaatacatattagggttatc^gcggatttataamgagtgatgcaUcgactcaacataa^ 

tcggatcgtaaatctgmctaaagaacggagaatatctato^ 

gtcttgtatgtcttaatcatattcttatgaaacttggaaacatct^ 

gacgatgctgagtamcatcgttgtatamcUcncgattgcataatcagaUcttatataccg 

tactctattattaatcagtcgttctaactc^ 

catacacgctacgaaaacgaaatctgtaatctataggcaac^^ 

Itaatggattggcaaaccgtaacataccgttagataactctgctccatttagta 

gcaactcttagccgaagcgtatgagtatagagcactam^ 

catggaatcatagatggcctmcagttgaactggtagcrt 

ggaatggttccttctatcgatctatcgaaaattgctamcagagatgaggttcggtagtctaggtt^ 

ggtggatamagaagcaatagctgattamamcttcttccaatcrtattg^ 

ccaaagatacacacattaggatacagactgttataatcaaagattaataca^ 

cttcataaggaaactmgtmgtttctgatctaactaagatagttttagm 

ctctatattcgaataccatggattgaggaagcacatatgttgacgcacccgcg^ 

acaraaacaagcatcatgaatacagtatctagccatatrt 

cmccgaaagataattutatgtatcattaggtaaagtaggacat^^ 

catataatatcctcatcaacagtcacataattacctgtggttaaaaccmgcaaatgcagcggctttg 

cgataaacgtcamctctaactcctctatttaatacmaccc^^ 

fflcagattffigaatgaatgaatatagatcgaaaaatatagft 

ttatgactagactgamctctcataaatacagagatgtacagcttccttmgtccggagatctaaagataatc^ 
agacgattagtaatatatacagatcaaagttatgtccgttaaaggtaacgacgtagtc^ 
.acaaaactamcagaacatagaactagttctcgttcgtaatccamrc^ 
amcctgttccgttaacatctcttcattaatgagcgtaaacaat^t^ 

gttaataaatacagaaggaaacttcttatcgaagtgacactctatatctagaaataagtacgatcttgg^ 
gcgaaacagttacgtggatcgtcacaatgataacatccattgttaatctttgtcaaa^ 
tatcccgttagaaatataaaaccaactaatattgagaaattc^tcxatggtggcatmgtatgctgcgmcm 
atctgcgacggagcatmctatctttaatatctagatt^^ 

aatggaggaggagacaatgactgatatamcgtccgtcactacgtaataaaagtaatgaggaaa 
gacatctggamcagatataaaaatctgtmcaccgtg^ 

65 kDa envelope protein (F12L) ORF 60 (43919-42012) +++ 2 
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UataatmaccatctgaGtcatgganc^ttaatatctttataagagctactaacgta 
tctatggmccataattgagtaaatgaatgttcggcaat 

atatmctatgagctgttccaataaatumgttgtgactgcgttcaagtcataaatcatcttg 

aatattattatcceattgtaaagccc^aattcgactatcgaatatcxtgctrtgatagca 

aaggtggtagfcttgtcatcatcgtgataaacta^ 

ttgtaccatttttaacgtagttgggacgtcctgcagggtatt^ 

tgattatttax^taatataatctagacagatagatgaftcgataaatagagaaggtatato 

ctcggatactctattaatgacactagnaagaacatgtcttcUttctagaaaacgaaaacat 

cctgattgtgtctcgaatgcctcgtacaaggamc^ 

attaaatcgaatggtcggctrtctggtttgctacccc^ 

ccaaataaccctagcaccatcggatgatattaatgtatt^^ 

tcgaatagattartcatgtaacctactagaatgatagttcgtgtactagtca 

cactgttaaagttaac^aaggtattocccgggtacgtggatatcate^ 

cgatggttmatatgtgmgataaacgaggaagaaattcgcacccacaattcatctctaga^ 

aamcgggacgcgtatatgmctaaattmaatccaaatataa^ 

gaacttacgatacatctgmcctataatcgttaaattttacaaatctat^catgctaaacctmgac^ 
gaatcrtgtattctcgataccgtattgttctaaag^ 

ctgaagttmggagaataatatgactcatgatctamcgtccataaacaatc^gacataggaattggaggcgatga 
atgagtcgtcaatcxtataacttrtaatcttgtaatattcatcatcgacataatactat 
camcgtgccaaaatgatatacagtcttaaatagttacgcaatatctcaatagmcataattgttagctgtm 
aacat 

62 kDa rifampicin resistence gene (D13L) ORF 145 (1 13026-1 1 1371) +++ 1 
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ttagttattatctcccataatcrtggtaatacttaccccttg 

aatagattggatggttgacatccatggtggaataaactactcgaacagatagtttatcmccccctagatacattggcx 

gccrtaaagaatatrtttggtgtaaagttaaaagttagggttc^^ 

gttctctgaatatagaacatcatttccaaatctaacttctagtctagaaata^ 

gttaatgaacaaatccttggccmgattcggctgatctattatctccgttatagacgtu 

gtatcgatgatgttgatactatgtgatatgtgagcaaagattgtt^ 

aatgttatatataaaagaatttmcgtgttccaaacattagcagatt 

atacacatcagcatcttgaatagaaacgatacxatcttctggaacrt 

actaacaataactagatcatccaacaatctactcacatatgcatctatat^ < 

atccgtamccataataaggmagjataaacagagagcgatgttgrc^ 

attactctcctaggtttctctataaacgatggm 

tgttgaacgmcaaag^cgaacgaagagtcacgaataacgatatcggatactggattgaaggttaccgtta 

agmaagactgctgaatgtatcttccacatcaaacggagtmaatataaacgtatactgtagatggttcm 

gccaatagaaatatrattaagttcactagaatatcx^agtgm^ 

ttcccaaataacarcgttacacgaagagatagatacgtgatt^ 

aacttctggaagttccaaactcagaaccaaatgattaagcgcagtaatatattg 

gaccatcgmgtrataartccggatagagaaatatattgcggcatatataaag^ 

ttaatagagtcatccccaccgatcaaagaattaatgatagtattattcat 

32 kDa carbonic anhydrase-like protein (D8L) ORF 137 (107120-106206) +++ 1 

ctagtmgttmctcgcgaatatcgtcgactc^ 
tttattcccttcgatatatttttgataatatgaaaaacatg^ 

gtagttgrtgctcgtataatctcxccagaataatatacttgcgtgtcgtcgttcaamatacggam 

ttccatcatgatt^acgacgac^te^ 

gtrtgcagagtgcttgatagttgttcxtagatatgtaaaataatra 

gcgcagacgtattagcggatctaatggaatccaattgattgactatctmga^ 

aataatgataagtccatcatcgtgttttmgcrt^ 

cacatctatcaagtgattggatccataatcgtcttcctttc^^ 

cttatatatcxtcctttaaaattaatccttactagtmcca^ 

tcgcgcgttagaaattgcttttttagtttctatattaataggagatagttgttgcggcat 

36 kDa late protein (I1L) ORF 87 (63935-62997) +++ 1 
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ttattcagcattacttgatatagtaatattaggcarag^ 

atatcttcgtaaaaagattcttgaaacttmagaatata^ 

gcgcccatmaacagmctagtgacaaaatgcrtagcgatcctagg 

tagtaaaataatcatacaatctagtacgcgaaataatattatccttgacttgaggagatctaaacaa 

atcgggaatgacatacatactatc^aatagaactctmcat^^ 

atcatmccagatgatatgtatgtccattaaagttaaattgtgtagcgcttcttttta^ 

tacaaaggagatgatttatctatggtattaagaattcgtttttcgacatccgt 

ttgtaaagaaattattttctactagartattaataagactgataaggatt 

cgagatctacaggaatgcgtacttcaggmct^ 

ttagcagtgaaataagcfflcaatgcacgggcartgatactattgaa^^ 

16 kDa protein (TC14L) ORF10 (10995-10567) +++ 1 

Ttaattgcaaagatctatataatcattatagcgttgacttatggacttf^ 

tacattgtmatagcatagtagttatctacgatgttagatam 

ttcagcagttcaatgmctagattcgttgatggcaatggrtatacatgtata^ 

agtaaagatactagagattgmattatatctaacagccttgtgaagaagtgm 

aggcaaatgtttatagtactaagaattgggcaagcataagacat 

38 lcDa serine protease inhibitor 2 (B13R) ORF 421 (172562-172912) ++ 4 

Atggatatcttcagggaaatcgcatcmcrtatgaaaggagagaatgta^ 

tatggagctaatggatccactgrtgaacagctatcaaaatatgtagaaaaggaggagaacatggata^ 

attcaaatccataaataaagtatatgggcgatattctgccgtgfflaaagattccttmgagaaaaattggcgataag 

tcactgattgtcgcactatagatgcaatcaacaagtgtgtagatatctttactgaggggaaaatcaatc^ 

ctgat^cctgtctcctagcaattagtgccgtatactttaaagcaaaatggttgacgccattcgaaaa 

cgtatctccgacggaaatggtagatgtaagtatgatgtctatgtacggcaaggcamaatcacgcatct 

tmcaatcatagaaclgccatatgttggagatactagtatgatggtcattcttccagacaag 

ctaacagatocaaattttaagaaatggtgtaactctctggaagctac 

aatctggtggatactctagtaaagtcaggactgaragaggtgttcggttcaa 

cgacgctatgatccacaaaacgtatatagatgtcaatgaagagtatacagaagcagrtg 

catcaacaattacaaatgagttctgtgtagatcatccgttcatrt 

ctccgacaactaattgttaa 

1 8 kDa protein (C7L) ORF 24 (19257-1 8805) ++ 3 

Ttaatccatggactrataatctctatacgggattaacggat 

atatttagactgatgt^tgggtaatagtgtttgaagagctcgttctcatcatcagaataaatcaatatctctgm 
cagcctcatatattacgtaatagaacgtgtcatctaccrtatl^ 
atttccgaccaatctgggcgtataatgaatctaaactttaatttcttgt^ 
taactgtaaamacaacgcgatataccattaataatgatgtcgaattcgtgc^gtatacccat 
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24.6 kDa protein (B2R) ORF 226 (163876-164535) ++ 2 

Atggcgatgtmacgracacgctctcggtgggtacgacgagaatc^ 

ggaaatattctgttgtgtcagttutaataacaagtatgacattgtaaaagacaaatatatgt^ 

ttggagcactgctgcxtatgmgagtgcaatgaatatctac 

acatatcgccacaaaaactactatgctctaagcggaatcgggtacgagagtctagacttgtg^ 

gtacttgaaacaggaaacgctgtatatggaaaagttcaacatgattattctac^ 

caggacctataattgattaccacgtctggataggagattgtatctgtc^ 

gagattcaaaaagggtgcggtgcttccgatcccaaatrtggtaaaagtta^ 

cggcggcaccatcgaggtaa 

36 kDa protein (Al 1R) ORF 164 (124976-125932) 4+ 1 

atgacgaccgtacc&gtgacggatataraaaacgamaa 

cacaacttaatgaagatctamccagatgatgaUctccggccactattatcgaaagagtacaa^ 

acctcctacgWcgtagagagttattgatatcggaacaacgtcaacaacgagaaaaaagatttaatattacagtatcg 

gcaataatggaatctagatctatgatatcttctatgccaacacaaacaccatc^ 

gttggaggatgaagtggttaatcttagaaatcaacgatctaatacaaa^ 

actccgtataaatcaacagaagttaataagcgtatagccatcgttaattatg 

tgtttgncagaggatgaaatagatagaatctataaaacgattaaacaatatcacgaaagtagaaaacgaaaaa 
attattattgtcataaarattatcgagcaagcattgctaaaactcggam^ 

atcgatgtggagatcggagatgactgcgatgctgtagcatctaaamggaatcggtaacagtccggttcttaatatt 
aagatattcgttaaacgaattaaaattatttaa 

I5~ft)a memfh^ ORF 167 (126785-127128) ++ * 1 

Ttagttcatggaaatatcgctatgattggtatgaatgactrc^ 
ttccgactgtgataataatacxaagtataaacgc^ 

aaggcgaagatacacgaaagaatcaaaagaatgattccagcgattagcacgccggaaaaataamcc^ 

147 kDa protein (J6R) ORF 1 17 (865 10-90370) ++ 1 
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atggctgtaatctctaaggttacgtatagtctatatgatcaaaaagagattaatgctacagatattat^ 

atatcggtaccgttaaagatggtagactagg^ 

ctggggtaaagtaagtamataaaactcatatagttaagctf 

attattgcgttcacgagaaccgtattccgacgatattaaccto 

craagaaaaagtcatgttggaacagcgaatgtatgcaarc^ 

gatgatattaacgttcctaattctctcatctatcaaaagttaamctattra^ 

acttatmatacagactacmcccatccctccgctgattattagaccggctattag 

attaacttacttattaggtatgatcgttaagaattgtaacttgaatgctgatgaacaggtto 

aaaattamc^aataacacttccagtatcaatttatcatatattacatccggcaaaaata 

agatcagaccgcrtagatctgtaattggtcccagtacatctatcaccgttaatgag^ 

gaaaagatamgttaatgcctttocagtggataaagttaaacaart^ 

aattaacaagaatacgccaaggaaagtttattaaaaataaaatacamattgcctggtgattgggtagaag^ 

agtattattrnggaagacagc^gtctctacatagatacaacgtcatcgcttcatctatca^ 

cccggaattgccaactctcaaaatgrtgamcgacggagatgaagaatggatgatattggagcaaaatcrt 

agtattcttatgtatccgacgacgttactraaacacgatattcat^ 

trattgtttagaatacaagatcmgtttagatgaagta^ 

tcagcggtaaagatatctatacttacttgataggtgaaaagattaa^ 

gatagtaattttgttgtggctatgaggcatctgtc^^ 

agtcatcttatgtttttaagagatatctatrtattta^^ 

gaggccatcaacgtagaaaaaatagaacttatcaaagaagcatacgccaaatatctcaa 

atttaaagcmagaggcggactatgtggaatccatgttat^^ 

acgcrtgatagatgatccagataataacctcctga 

cttatggacaacagaggattgatggtgaaccagcagagactcgagtattgggte^ 
agaaggaagaggttatattcttaattc^aacaaaaggattaacaggttctcaa^ 
atotcgtcrtgtgaaacatcacgtarcggaacact^ 

agtagttataggtaatacgctcatcaagtacgccgccaattataccaaaattctaggctcagtatgtaaac 
tgagtccatgacttggtamggaaattagtgctctgtg^ 

agacattggcgccgmaamcctagtattcgtcaaacccM 

acgtcattgatgatgtgagagagaaatacttc^acggtatctaatatagatmatggagtatatatt 

ttagaattacaaaagaaacggctatcattatcmgaaaagttctatgaa^ 

ttctgcacaggtattgtctgagaagmacacaacaagccctgtccagtmcaca^ 

ggmcaacgagmaataacctgactaamgagtaagaataagaccgaaattatcactrtggtatccgatg 

ttaagattaafficgaaffigtatgmgggagaattaaatccaaara^ 

caatagattatacatc^gagagcagaaatteccgaattagtcgtcgaatatatgattgaacgatttatrt 

at Bgggtatggagacattcattgaggacgaggataatattagattt^gtcto 

gtttatgatggttmccgggtgrcgccaacaagggcaagattagt 

atcaaacaaaaaagcrtcaataagatgactgtagaartcatgaat 

ggagtatggaatacatacgatatcttcggtatcgaggccgctcgtgaatacttgtgcgaagc^ 

gattatct^atcagccttgtgatcttctcgctagtttactatgtgctagttacgaaccagaatc^ 

gtactcttaagagagctacgttcggagac^taaagcattg^ 

ctgccactttmagcaaggtcxxtaatataggaaaggatattac^aatactttatcgac^ 

atctgataagatatcttctcaaaagatcaaggaaatggaagaaacagaagacttttaa 
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77 kDa protein (OIL)) ORF 84 (62477-60477) ++ 1 

ttaacgagttccatttatatcatccaatattattgaaatgacgttgatgg 

crtcxtccaattcatgctctetmgtcattaacraaatgtatgaa^ 

aatgmgacattagtataattgtttoagactgtcaatc^ 

tggcatattgatcatttaacacagacatggtatcaacagatagcttgaatgaaagagaatcagtaa 

gtgtccgtataccaacatgtctgatatWgatgtattccattaaattattt ^ 

ccaacatcgttgaccgattaagtmgattgattmecgtgtaaggcgtatctagtcagat 

gtagatcacatcgtacactttttaattrtctatagaagagcgara^ 

aagatacttgaagacattcctatgatgatgcagaatmggataac^ 

gtcagagcacaagamcx;aatcmgacaatttttagcaccattatcmgtm 

gggattaagacggaaagatgaaatgaUctctcaacatcttcaatggatacc^g 

ctagagaatcagtatGCttmgatgatagtggatcrtcaatgacatgggacgtcrtaaac^ 

cttcmctmatcataatgtaatctctaaattcatcggcaaattgtctata^ 

tccaatgttagagtatctacatragttttgtattccaaa 

cagaatgtagataatcamaatcx^tcgtacatggttggaagatgcttgttgac^aaa 

aacatcngattaataaaalttataacaftgtccataggatactttgtaactagtm 

tgaacaggtggtatattatattcatcagatatacgaagaacaatgtccaaatctata^ 

aggaatatcmaactaagtcaatgamcatcaaccg^ 

actacattctcattaattaaccattcrau^ 

gaattcttatgatataaggaaacagcttttaggtactcatctactctacaagaatmg^ 

aggaggaaaaaacctaacattgagaatgtcggagttaatagcttccagatacagtgatmggcaatag^ 

aacacgagctggtgcttgctagacacctmcaatgtttaattttmgaaataagcm 

cat 

59 kDa protein (C2L) ORF30 (241 56-2261 8) + 4 
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ctattgtagaaattgttmcacagttgctcaaaaacgatggcagtgacUatgagttacgttacac^ 

ataatattcgatattacgagttgacatatcgaacaaaftrcaagtamgatmgga 

caccgcaagaacacacgaacatc^cctacatggttaaagta^ 

tacgagtctcgtgagtaattccagtaattacatagatgtcgcc^ 

tttmatccaacgattmagtgaaacattccacatcgtttaatactacat^ 

gmacgaataccgacgcgcctgaatatctaggagtaattaagmggaagtcttatccamcgaagtgcx 

acccgftgaaatagaaaattctaatcrtcctatto 

taaccgtmccatttmcgmcaagatc^acccgcgatacggaataaacatgtctattgttaa^ 

gtaaaacamgcattatagaattgtc^tctgtattaccgactatcgtccaatattct 

cagagtttttaatgactactatattatgtttta^ 

cgcatagtottagtcataaacttgggatgtaaaatgttgatgatatctacatcg 

cat(xtcatgamacgttaacgtcttcgtgggateagatagttgt 

gtaatattgttgattamctgacatcgacgcattotatagtttmaatt^ 

atattatgaatcalagttmacacatagatctactacaggcggaacatcaattattacggcagcaaclagta 
gatgmatcttcttccagcgcatatagtttaatagcgattc^ 
atcctgaatgcgtttaaaaaaattatacggagacgcxgtaataatttccttattcactt 




ccat 



90 kDa protein (D5R) 



ORF132 (101420-103777) 



+ 
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cgtagaagcamaaatgcgacgagttaaaaagatatattg 

tactctatagtcagaatmcatggatgtagamagacgcgtgtcto^ 

gtcaaactgtgtagctagattcgcgmacagaatgcggtgccatt 

tctacaaatagagataaaacaagtmcatattatctttttagacac^ 

aattaagtagatcatctgaaaatccactaacaagatcgatagacactgccgta^ 

gaaaaatccaaattgcgacamttcatgtaatg^ 

atagttattac^tttrtctacaacgacgattggaggatttagttcctgataagttatggga^ 

agagtttcaaaaa tat tcattaattctataataaact^^ 

accttgtgcattatgtaaaaaacgatcgcataaacatasgcat 

cacatagttgtaaagttaaaattgttccgttggatggtaataaactgtttaatattgca^ 

aacgaggagactatatagmggattaataattcatggaaatttaacagcgaagaacccttgataacaaaart 

caactacctaaggaatattcaagcgaattactcrtgtccgaggaaacga 

gtagagaccgatacctatc^ggataaacttccgtttaaaaatggtgtattggacctggtagacggaatgtm 

aaaatatacgtgtactgtatcaaccggamaaamgacgatacaaa 

attaacgatatccaaccattaacggatg aaaataagaaaaat agagagctatat^ 

aggatgtttaacattctttmggagaaactgcaactggaaagtcgacaaccaaacgm 

gacgggtcaaac^tmaacagatgtattggataaaggacctaatccatttatcgctaacatgcam 

actacctgatmgartgtagtggatcaaagaaaattagatc^ 

ctccaataaaattaataatagaaaccatgctacaatcattatcgate 

aagaattgcxgtcgtgcgattcagaacarartmctcaaccttct^ 

actattagacgaggggttagatggtaaaatacaaaataatagatatagamgram 

gttcctattatgaaactatatcctacacccgaagagattcctg^ 

gcatattccattaatgacggacctctccaaaaagggatatatattgtacgataatgtggttactc^ 

tccaaglattttaattctagartamggacacgatatagagagcttcatcaatagacataagaaamg 

aatatatattcatagaggatatttcatctccgtaa 

23 kDa protein (A17L) ORF170 (129314-128703) + 1 

ttaataatcgtcagtatttaaactgttaaatgttggtotatc 

aatggttacatttatacttcttctatagtcctgtctttcgatgto 

aaatatctgtgaattcgtaaatacattgattgccataataattacag 

tccacgatacatttgagttactaagcaataggtaataactaagctagt^^ 

attagaggagggctatatagagcc^gacgaacaaaatcaaaccgagjaacgttctaac^^ 

cattcctccataatcgtmgcatcatacctccatcmaggcataaacgattgctgctgttcctctgtaaataaat 

acccgcagagaagtcgtcaagcatattgtaatatcttaaataactcat 
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SEQUENZ PROTOKOLL 

<110> Ugur Sahin, Czlem TUreci, Burkhard Ludewig 

5 <120> Verfahren zur Identif izierung biologisch aktiver 
Strukturen mikrobieller Erreger 

<130> 268-3 PCT 

0 <150> DE 10108626.1 
<151> 2001-02-22 

<160> 22 

5 <170> Patentln Ver. 2.1 

<210> 1 
<211> 32 
<212> DNA 
0 <213> KUnstliche Sequenz 

<220> 

<223> Beschreibung der kUnstlichen Sequenz: 
Adaptor-N (6) -Oligonukleotide 

■5 

<400> 1 

gatgtaatac gaattggact catatannnn nn 

0 <210> 2 
<211> 25 
<212> DNA 

<213> KUnstliche Sequenz 
5 <22 0> 

<223> Beschreibung der kUnstlichen Sequenz: 
EcoRI-Adaptor-Oligonukleotide 

<400> 2 

0 gatgtaatac gaattcgact catat 



<210> 3 

<211> 24 

•5 <212> DNA 

<213> KUnstliche Sequenz 

<220> 

<223> Beschreibung der kUnstlichen Sequenz: 
0 Mf el-Adaptor-Oligonukleotide 

<400> 3 

gatgtaatac aattggactc atat 

5 

<210> 4 
<211> 846 
<212> DNA 

<213> Vaccinia virus 

►0 

<400> 4 
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ttacttttgg aatcgttcaa aaectttgac 

cgtatactcc cttgcatcat atacgttcgt 

gtgcatatct ttttcaacac tcgacatgag 

ttgagatgct gctcctggat ttggattttg 

5 aggtgtagga gtacatacag tggccacaat 

agtacaagaa atatttccat ccgattgttg 

aggttgggta gatggcggcg tcgtcgtttt 

ctgaacagca ttgctcggcg tcaacgctgg 

ttcagacagc caatcaaaaa gattagacat 

10 ttttggtgta ggagcagtac tactaggtag 

cggctgtgga gttatatgaa tagttggttg 

catcatatta tctctagcta gttgttctcg 

ctttagtcct atttcaatcg cttcatcctt 

atagattgac gactttggtg tagaggattc 

15 gtccat 



<210> 5 
<211> 2178 
20 <212> DNA 

<213> Vaccinia virus 

<400> 5 

ctaagacgtc gcatctctct ctgtttcggc 

25 caactgtctt tcaagatctg atattctaga 
acggcattca ctcagttgtc tttcaagatc 
tgtaagattt cctcctccgc tctcgatgca 
acgcgaacgc agtgcatcaa cttcttgcgt 
tctagattcg agatctctaa cgcgtcgtcg 

30 aagcgtgtcc ctatcttgtt gatatttagc 
tacgtagtta ctaatatttg tcttggcctt 
cttgatatcc ctacgaagtc tggacagttc 
agctcggaga tcgtcatcgc gttgttttag 
acaagatcca tctacttttc cattcctaat 

35 catttctcgt tccctatcaa gcgattctct 
taataaatct gaaccatcat ctgtcccatt 
tgtaagtcgg tcgattcttt cggttttata 
actgagttta tcactaagtt ctgcattcaa 
ctctgtttta aactctccac tatttccgca 

40 tagtttatta ataactagtt ggtaatcagc 
aacataatta ggatcttcta atggattgta 
a gggggatgg acaaccttaa ttggttggtc 
aataccagtg ttagtaatag gcttaggcaa 
catcaagtat ttataatcgg gttctacttc 

45 gggagttagt agaagaactc tgtttctgta 
aaggatagcg aatacctcat cgtcatcatc 
ttcatgaagt ctaacgtatt gataaataga 
ctttttagta aacgcatatg tatattttag 
cttaaatgtc agtgcttcca tgatataatc 

50 cggaccatat gctacgttga taaataactc 
aaggaagagg aaatattcag tatataggta 
gctaaacagt ttgttaatgt gatcaatttc 
aacaaacata ttaccacatc cgtattttct 
tgatagaaga gcgaatatct cgtctgactt 

55 cataactgta aatagaacat actttcctgt 
attattaaaa atagttttat atacatcttt 
tagtatacgg aaacactttg atttcttatc 
aatattacga attacatttc ttgtttttct 
gttccatagt ttttctacct cagtggcgaa 

60 aaggttcgtg acctccat 



tagttgtaga atttgatcta ttgccctacg 60 
caccagatcg tttgtttcgg cctgaagttg 120 
atccttaagg gccatatcgt ctagattttg 180 
ttgtgctgtt gtacatactg taccaccagt 240 
aggaggttga ggaggtgtaa ccgttggagt 300 
tgtacatgta gttgttggta acgtctgaga 360 
ttgatcttta ttaaatttag agataatatc 420 
aaggagtgaa ctcgccggcg catcagtatc 480 
atcagatgat gtattagttt gttgtcgtgg 54 0 
aagaatagga gccggtgtag ctgttggaac 600 
tagcggttgg ataggctgtc tgctggcggc 660 
caactgtctt tgataatacg actcttgaga 72 0 
tttcgtatcc ggatcctttt cttcagaata 780 
tgccagcccc tgtgagaact tgttaaagaa 840 

846 



attggtttca ttattacgtc tacagtcgtt 60 
ttggagtctg ctaatctctg tagcattttc 120 
tgagatttta gattggagtc tgctaatctc 180 
gtcggtcaac ttattctcta gttctctaat 24 0 
gtcttcctgg ttgcgtgtac attcatcgag 300 
ttcttcctca agttctctgc gtactacaga 360 
aatttctgat tctagagtac tgattttgct 420 
atcaagatcc tccttgtatt tgtcgcattc 4 80 
ccattcgaca ttacgacgtt tatcgatttc 54 0 
ccacatacga ctgagttcaa gttctcgttg 600 
agtatccagt tccttttcta gttctgaacg 660 
caattctcgg atagtcttct tatcaatttc 720 
ttgaatatcc ctgtgttctt tgatctcttt 780 
aacagaatcc ctttccaaag tcctaatctt 84 0 
ttcggtgagt tttctcttgg cttcttccaa 900 
ttcttcctcg catttatcta accattcaat 960 
gattcctata gccgttcttg taattgtggg 1020 
tggcttgata gcatcatctt tatcattatt 1080 
ctcatctcct ccagtagcgt gtggttcttc 1140 
atgcttgtcg tacgcgggca cttcctcatc 12 00 
agaatattct tttctaagag acgcgacttc 1260 
tctatcaacg ctggaatcaa tactcaagtt 1320 
cgtatcttct gaaacaccat catatgacat 1380 
atcagattta gtattaaaca gatccttaac 1440 
atctccagat ttcataatat gatcacatgc 1500 
tggaacacta atgggtgatg aaaaagatac 1560 
tgaaccacta agtagataat gattaatgtt 1620 
tgtcttggcg tcatatcttg tactaaacac 1680 
caatagatta attagagcag caggaatacc 1740 
atgaatatca catatcatgt taaaaaatct 1800 
aatgagtcgt agttcagcag caacataagt 1860 
agtattgatt ctagactccg catcaacacc 1920 
aatctgctct ccgttaatcg tcgaacgttc 1980 
tgtagttaat gacttagtga tatcacgaag 2040 
tgagagacat gattcagaac tcaactcatc 2100 
atctttggag tgcttggtac atttttcaat 2160 

2178 
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<210> 6 
<211> 954 
<212> DNA 
5 <213> Vaccinia virus 

<400> 6 

atgaaaacga tttccgttgt tacgttgtta 
tgtactgtac ccactatgaa taacgctaaa 

10 aaccagaaag ttacgtttac atgtgatcag 
tgcgaaacag ataaatggaa atacgaaaat 
tacatctctg aactatataa taaaccgcta 
tgcaacggcg aaacaaaata ttttcgttgc 
gatactgtta cgtgtcctaa tgcggaatgt 

15 caaccagtta aagaaaaata ctcatttggg 
tatgaggtta ttggtgcttc gtacataagt 
tcatgtcaac aaaaatgtga tataccgtct 
ttttctatcg gtggcgttat acatcttagt 
ccatcatcca catgtatcga cggtaaatgg 

20 aacgaagaat ttgatccagt ggatgatggt 
tcgaaagacg ttgtacaata tgaacaagaa 
atcatagtgg cgttaacaat tatgggcgtc 
tgttcctgtg acaaaaataa tgaccaatat 

25 

<210> 7 
<211> 3021 
<212> DNA 

<213> Vaccinia virus 

30 

<400> 7 

ttatgcttcg taaaatgtag gttttgaacc 
aactttatta tccaatagat tgactatttc 
aaatattctt tgatcactgc cgagtttaaa 

35 aatatttaca agttttttgg tccatggtac 
tcgttctcca agttctatag, tttctggatt 
attagggtta tctgcggatt tataatttga 
tagaggagac gatctactat caaattcgga 
atctatacat acctgattag aattcatccg 

40 cttgtatgtc ttaatcatat tcttatgaaa 
acctttatta attctctcag gtacagattt 
tgtatatttc ttcttcgatt gcataatcag 
aaaattatta aacaatactc tattattaat 
agacttatcg acatcttgac tgtctatctc 

45 gctacgaaaa cgaaatctgt aatctatagg 
tctatcgtcc atataaaatg gattacttaa 
taactctgct ccatttagta ccgattctag 
gcaactctta gccgaagcgt atgagtatag 
tactgagttg gctactatct tgtacgtata 

50 tgaactggta gcctgtttta acatcttttt 
taatagtcta ggaatggttc cttctatcga 
gttcggtagt ctaggttcac aatgaaccgt 
caatagctga ttatttattt cttcttccaa 
tgtttccgga gatagatttc caaagataca 

55 gattaataca ttattactaa acattttttg 
aggaaacttt tgttttgttt ctgatctaac 
taacagtgga cccttgatga ctgtactcgc 
cacatatgtt gacgcacccg cgtctgtttt 
ctgacacaaa caagcatcat gaatacagta 

60 ataatcctta tacatctgag ctaaatcaac 
atcattaggt aaagtaggac ataatagtac 



tgcgtactac ctgctgttgt ttattcaaca 60 
ttaacgtcta ccgaaacatc gtttaataat 120 
ggatatcatt cttcggatcc aaatgctgtc 18 0 
ccatgcaaaa aaatgtgcac agtttctgat 24 0 
tacgaagtga attccaccat gacactaagt 300 
gaagaaaaaa atggaaatac ttcttggaat 360 
caacctcttc aattagaaca cggatcgtgt 420 
gaatatatga ctatcaactg tgatgttgga 480 
tgtacagcta attcttggaa tgttattcca 54 0 
ctatctaatg gattaatttc cggatctaca 600 
tgtaaaagtg gttttatact aacgggatct 660 
aatcccgtac tcccaatatg tgtacgaact 720 
cccgacgatg agacagattt gagcaaactc 780 
atagaatcgt tagaagcaac ttatcatata 840 
atatttttaa tctccgttat agtattagtt 900 
aagttccata aattgctacc gtaa 954 



aaacattctt tcaaagaatg agatgcataa 60 
ggacgtcaat cgtttaaagt aaacttcgta 120 
acttctatcg ataattgtct catatgtttt 180 
attagccgga caaatatatg caaaataata 24 0 
atttttatta tattcagtaa ccaaatacat 300 
gtgatgcatt cgactcaaca taaataattc 360 
tcgtaaatct gtttctaaag aacggagaat 420 
tccttcagac aacatctcag acagtctggt 480 
cttggaaaca tctcttctag tttcactagt 540 
tgaattcgac gatgctgagt atttcatcgt 600 
attcttatat accgcctcaa actctatttt 660 
cagtcgttct aactctttcg ctatttctat 720 
tgtaaacacg gagtcggtat ctccatacac 780 
caacgatgtt ttcacaatcg gattaatatc 840 
tggattggca aaccgtaaca taccgttaga 900 
atacaagatc attctacgtc ctatggatgt 960 
agcactattt ctaaatccca tcagaccata 1020 
ttgcatggaa tcatagatgg ccttttcagt 1080 
atatctggct ctctctgcca aaaatgttct 114 0 
tctatcgaaa attgctattt cagagatgag 1200 
aatatatcta ggaggtggat atttctgaag 1260 
tctattggta ctaacaacga caccgactaa 1320 
cacattagga tacagactgt tataatcaaa 138 0 
ttttggagca aataccttac cgccttcata 1440 
taagatagtt ttagtttcca acaatagctt 1500 
tctatattcg aataccatgg attgaggaag 1560 
tgtttctact ccataatact cccacaaata 1620 
tctagccata tctaaagcta tgtttagatt 1680 
gtcatccttt ccgaaagata atttatatgt 1740 
gactttaaat ccattttccc aaatatcttt 1800 
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acgaattact ttacatataa tatcctcatc 

ctttgcaaat gcagcggctt tgcctttcgc 

ttctctaact cetctattta atactttacc 

atccaatttg tacgaatcca atttttcaga 

5 tatagttcca ttattgttat taacgtgaaa 

atgactagac tgatttctct cataaataca 

tctaaagata atcttctctc ctgttaataa 

aaagttatgt ccgttaaagg taacgacgta 

tattcgtaac aaaactattt cagaacatag 

10 tagtgactgt atcctcaaac atcctctatc 

catctcttca ttaatgagcg taaacaataa 

acttgtatgc gagattgggt taataaatac 

tatatctaga aataagtacg atcttgggat 

gttacgtgga tcgtcacaat gataacatcc 

15 caacgagtaa catccgtctg gagatatccc 

aaattcatcc atggtggcat tttgtatgct 

atctgcgacg gagcattttc tatctttaat 

gtctatagtt ctcatctttc ccaacggcct 

atatatttcg tccgtcacta cgtaataaaa 

20 accatttcga catctggatt tcagatataa 

attaatgcac cgaacatcca t 
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aacagtcaca taattacctg tggttaaaac 1860 
gtctgtagta tcgtcaccga taaacgtcat 1920 
catgcaactg aacgcgttct tggatataga 1980 
tttttgaatg aatgaatata gatcgaaaaa 2040 
cgtagtattg gccatgccgc ctactccctt 2100 
gagatgtaca gcttcctttt tgtecggaga 2160 
etctagacga ttagtaatat atctcagatc 2220 
gtcgaacgtt agttccaaca attgtttagc 2280 
aactagttct cgttcgtaat ccatttccat 2340 
gacggcttct tgtatttcct gttccgttaa 2400 
tcgtttacca cttaaatcga tataacagta 24 60 
agaaggaaac ttcttatcga agtgacactc 2520 
atcgaatcta ggtatttttt tagcgaaaca 2580 
attgttaatc tttgtcaaat attgctcgtc 2640 
gttagaaata taaaaccaac taatattgag 2700 
gcgtttcttt ggctcttcta tcaaccacat 2760 
atctagatta taacttattg tctcgtcaat 2820 
cgcattaaat ggaggaggag acaatgactg 2880 
gtaatgagga aatcgtataa atacggtctc 2940 
aaatctgttt tcaccgtgac tttcaaacca 3000 

3021 



<210> 8 
25 <211> 1908 
<212> DNA 

<213> Vaccinia virus 
<400> 8 

30 ttataatttt accatctgac tcatggattc 

taattcttta taactgaact gagatatata 

aatgaatgct cggcaataac taatggcaaa 

gttaaagtta atattttcta tgagctgttc 

gtcataaatc atcttgatac tatccagtaa 

35 ccattgtaaa gcccctaatt cgactatcga 

gacggacgtc aatactgtaa taaaggtggt 

aatatggtcg ttagtaggta cggtaacttt 

accattttta acgtagttgg gacgtcctgc 

aacagatttg atacgatatt tgttggattc 

40 gatagatgat tcgataaata gagaaggtat 

agtattctcg gatactctat taatgacact 

cgaaaacatc ctacatggac tcattaaaac 

ctcgtacaag gatttcaagg atgccataga 

agcatctgat ttttttatta aatcgaatgg 

45 acaatagtct tgtaaagata aaccgcaaga 

agcaccatcg gatgatatta atgtattatt 

gtatactgtt agcaacggta tatcgaatag 

tcgtgtacta gtcataatat ctttaatcca 

actgttaaag ttaacaaagg tattacccgg 

50 attatcagta atagctccat aaactgatac 

cgaggaagaa attcgcaccc acaattcatc 

cacatcaatt tcgggacgcg tatatgtttc 

tatatgccct attatcatac tgtcaactat 

tttcctataa tcgttaaatt ttacaaatct 

55 ttcattaatt tctgatatgg aatctgtatt 

tatatctccc tgttcgtggg aacgctttcg 

ttttggagaa taatatgact catgatctat 

tggaggcgat gatcttaatt ttgtgcaatg 

aatattcatc atcgacataa tactatctat 

60 ttcttcattt cgtgccaaaa tgatatacag 

ttcataattg ttagctgttt tcatcaagat 



attaatatct ttataagagc tactaacgta 60 
caccggatct atggtttcca taattgagta 12 0 
tgtatagaac aacgaaatta tactagagtt 18 0 
caataaatta tttgttgtga ctgcgttcaa 24 0 
accgttttta agttctggaa tattattatc 300 
atatcctgct ctgatagcag tttcaatatc 360 
agtattgtca tcatcgtgat aaactactgg 420 
acacaacgcg atatataact ttccttttgt 4 80 
agggtattgt tttgaagaaa tgatatcgag 540 
ctgattattt actataatat aatctagaca 600 
atcgttggta ggataataca tccccattcc 660 
agttaagaac atgtcttcta ttctagaaaa 720 
ttctaacgct cctgattgtg tctcgaatgc 7 80 
ttctttgacc aacgatttag aattgcgttt 840 
tcggctctct ggtttgctac cccaatgata 900 
aaatttatac gcatccatcc aaataaccct 960 
atagattttc catccacaat tattgggcca 1020 
attactcatg taacctacta gaatgatagt 1080 
atctaagaaa tttaaaatta gattttttac 1140 
gtacgtggat atcatatatg gtattggtcc 1200 
ggcgatggtt tttatatgtg tttgatctaa 1260 
tctagatatg tatttaatat caaacggtaa 1320 
taaattttta atccaaatat aatgatgacc 1380 
agtacaccta gagaacttac gatacatctg 1440 
ataacatgct aaaccttttg acgacaacca 1500 
ctcgataccg tattgttcta aagccagtgc 1560 
tataatatcg atcaacggat aatctgaagt 1620 
ttcgtccata aacaatctag acataggaat 1680 
agtcgtcaat cctataactt ctaatcttgt 1740 
gttatcatcg tatattagta taccatgacc 1800 
tcttaaatag ttacgcaata tctcaatagt 1860 
ttgtaccctg tttaacat 1908 
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<210> 9 
<211> 1656 
<212> DNA 

<213> Vaccinia virus 



10 



15 



20 



25 



30 



35 



<400> 9 

ttagttatta 

caggtcatta 

catggtggaa 

aatagttgtc 

attattgctt 

tagaacatca 

atctattccc 

tctattatct 

atcgatgatg 

atatgttcca 

tgttccaaac 

aatttttaca 

gatctcggca 

caacaatcta 

cgaaataaat 

tgccgcatga 

aggtttctct 

caattcagga 

aataacgata 

tttaagactg 

agatggttct 

agaatatcca 

gccctcaatt 

atatccaaca 

actcagaacc 

agcctgattg 

atataaagtt 

cccaccgatc 



tctcccataa 
catacaacta 
taaactactc 
ggcctaaaga 
tttgtcagta 
tttccaaatc 
ttgatgaagg 
ccgttataga 
ttgatactat 
gtaatggcgg 
attagcagat 
tacacatcag 
gactccggat 
ctcacatatg 
ttattatccg 
acttcagtta 
ataaacgatg 
acataaacaa 
tcggatactg 
ctgaatgtat 
ttaatagtgt 
gagtgtttca 
tcccaaataa 
tatggtacgt 
aaatgattaa 
tctggaccat 
ggaatttgac 
aaagaattaa 



tcttggtaat 
ccaattgttt 
gaacagatag 
atatctttgg 
gttcattata 
taacttctag 
gatcgttaat 
cgttacgttg 
gtgatatgtg 
aaaacttttt 
tagtatgaag 
catcttgaat 
aaccagtcgg 
catctatata 
tatttccata 
cagtcgccgt 
gtttaatttg 
attctttgtt 
gattgaaggt 
cttccacatc 
cattaggagt 
aagcaattgt 
caccgttaca 
aaccgaatct 
gcgcagtaat 
cgtttgtcat 
tatcgactgc 
tgatagtatt 



acttacccct 
ttgtacataa 
tttatctttc 
tgtaaagtta 
aattctcgag 
tctagaaata 
gaacaaatcc 
actagtccaa 
agcaaagatt 
agaaatgtta 
ataaacactc 
agaaacgata 
tgggccatca 
atctttttca 
ataaggttta 
tggttggttt 
tacattctta 
gaacgtttca 
taccgttacg 
aaacggagtt 
taggccaata 
attattgata 
cgaagagata 
tcccatacct 
atactgatcc 
aactccggat 
gaagacatta 
attcat 



tgatcgtaag 
tagattggat 
cccctagata 
aaagttaggg 
atgggtccgt 
atatcggtct 
ttggcctttg 
agacttacag 
gttctcttag 
tatataaaag 
atattatcag 
ccatcttctg 
ctaacaataa 
tcttgtgagt 
gtataaacag 
atttgaccta 
accatatatc 
aagtcgaacg 
gtaatttttg 
ttaatataaa 
gaaatatcat 
caattattat 
gatacgtgat 
ttaacttctg 
ctaatttcga 
agagaaatat 
gaccgtttaa 



ataccttata 
ggttgacatc 
cattggccgt 
ttcttgttcc 
tctctgaata 
tattcttaaa 
attcggctga 
gaatagatgt 
tggcatcact 
aattttttcg 
gaacattatc 
gaacctctac 
ctagatcatc 
accctggata 
agagcgatgt 
ttactctcct 
caataaagct 
aagagtcacg 
aatcggatag 
cgtatactgt 
taagttcact 
ataattcttc 
taatacattt 
gaagttccaa 
agctagcgat 
attgcggcat 
tagagtcatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1656 



<210> 10 
40 <211> 915 
<212> DNA 

<213> Vaccinia virus 



45 



50 



55 



60 



<400> 10 

ctagttttgt 

aaacacgaat 

atatgaaaaa 

tggagaggta 

caatttatac 

cgacgacaat 

aaaaattatc 

atccaacgta 

attagcggat 

atccgatact 

ttcataagaa 

gtacacatct 

tgatgataac 

aatccttact 

gtctaacggc 

tagttgttgc 



ttttctcgcg 
actatggcaa 
catgtctctc 
gttgctgctc 
ggatttctat 
agtgttctaa 
catacagcgt 
ctaggtagca 
ctaatggaat 
tgtaagaata 
ctatattttt 
atcaagtgat 
acatattcat 
agttttccag 
ttcaatcgcg 
ggcat 



aatatcgtcg 
taattgcgaa 
tcaaatcgga 
gtataatctc 
agttctctgt 
atttagatag 
ctgcagagtg 
aattgtctag 
ccaattgatt 
tagaaataat 
tcttattcca 
tggatccata 
tggggagaaa 
tgttctggat 
cgttagaaat 



actcataaga 
tgttttattc 
caaccatctc 
cccagaataa 
tatataatac 
ttgatcagaa 
cttgatagtt 
ataaaatact 
gactatcttt 
gataagtcca 
atgaacaaga 
atcgtcttcc 
ccctccactt 
agtggttggt 
tgctttttta 



aagagaatag 
ccttcgatat 
ataaaatagt 
tatacttgcg 
ggttttccat 
tgaatgttta 
gttcctagat 
gaatcaaacg 
tgaaaatata 
tcatcgtgtt 
ttaatctctc 
tttccccaat 
atatatcctc 
ttcgactcat 
gtttctatat 



cggtaagtat 60 

atttttgata 120 

tctcgcgcgc 180 

tgtcgtcgtt 240 

catgattaga 300 

ttggcgttgg 360 

atgtaaaata 420 

gcgcagacgt 480 

catttttatg 540 

tttttgcctc 600 

cagagtattt 660 

atatatgtag 720 

ctttaaaatt 780 

tataatgtat 840 

taataggaga 900 
915 
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<210> 11 
<211> 939 
<212> DNA 

<213> Vaccinia virus 



<400> 11 

ttattcagca 

tacattaact 

10 aaacttttta 
tgtatacata 
atcctttaga 
atacaatcta 
tttgagaaca 

15 ttcatccagt 
attttccaga 
agcagccaat 
attaagaatt 
ttttccatcc 

20 tcctccataa 
aatgcgtact 
caactcatct 
gatactattg 



25 



30 



35 



40 



ttacttgata 
ctctcatttt 
gaatatctat 
aaggcgccca 
atcacataga 
gtacgcgaaa 
tcgataagtt 
tgaatggatt 
tgatatgtat 
actttaacat 
cgtttttcga 
tttgtaaaga 
ttgcacaatc 
tcaggtttct 
accatttcat 
aaaacgagtt 



tagtaatatt 
ctttaacaaa 
cgactctaga 
ttttaacagt 
ttgacgattc 
taatattatc 
catcgggaat 
cgtccttaac 
gtccattaaa 
cactaatatc 
catccgtcaa 
aattattttc 
caaacttttt 
tagcttgtga 
tgattttagc 
gatcttcaaa 



aggcacagtc 
ttctgcaata 
tgaaatagcg 
ttctagtgac 
gtctctctta 
cttgacttga 
gacatacata 
caactgatta 
gttaaattgt 
gatatacaaa 
aaccaattcc 
tactagacta 
cacaaaacta 
ttttttcttt 
agtgaaataa 
ttccgccat 



aaacattcaa 
tcttcgtaaa 
ttcgtcaaca 
aaaatgctag 
gtaactctag 
ggagatctaa 
ctatctttaa 
atgagatctt 
gtagcgcttc 
ggagatgatt 
tttttgcctg 
ttaataagac 
gactttacga 
tgcggacatt 
gctttcaatg 



ccactctcga 
aagattcttg 
tactatgttt 
cgatcctagg 
taaaataatc 
acaatctagt 
tagaactctt 
ctattttatc 
tttttagtct 
tatctatggt 
tatcatccag 
tgataaggat 
gatctacagg 
ttcttgtgac 
cacgggcact 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

939 



<210> 12 
<211> 429 
<212> DNA 

<213> Vaccinia virus 



<400> 12 

ttaattgcaa 

cgatgtacag 

atctacgatg 

acataatagc 

tgtatatccg 

tagagattgt 

catgttaatg 

ataagacat 



agatctatat 
tcatctataa 
ttagatattt 
attttcagca 
ttatttgatc 
ttattatatc 
tctttaagat 



aatcattata 
tcatggcata 
ctctcaatga 
gttcaatgtt 
taatgttgac 
taacagcctt 
aaggtaggca 



gcgttgactt 
tttaatacat 
atcaatcaca 
tctagattcg 
atctgaaccg 
gtgaagaagt 
aatgtttata 



atggactctg 
tgttttatag 
taatctaatg 
ttgatggcaa 
gattctagca 
gtttctcctc 
gtactaagaa 



gaatcttaga 60 
catagtagtt 120 
taggtttatg 180 
tggctataca 24 0 
gtaaagatac 300 
gtttgtcaat 360 
ttgggcaagc 420 
429 



45 



<210> 13 
<211> 1038 
<212> DNA 

<213> Vaccinia virus 



50 



55 



60 



<400> 13 

atggatatct 

gcgtcaatct 

cagctatcaa 

tcattcaaat 

ttgagaaaaa 

gcaatcaaca 

ccattgtctc 

ttgacgccat 

atggtagatg 

gaatcattcg 

gtcattcttc 

aattttaaga 

tttaaggtaa 

gtgttcggtt 



tcagggaaat 
cgtcagtatt 
aatatgtaga 
ccataaataa 
ttggcgataa 
agtgtgtaga 
ctgatacctg 
tcgaaaagga 
taagtatgat 
gcaacttttc 
cagacaagat 
aatggtgtaa 
caggctcgta 
caactggaga 



cgcatcttct 
gacaatactg 
aaaggaggag 
agtatatggg 
gtttcaaact 
tatctttact 
tctcctagca 
atttaccagt 
gtctatgtac 
aatcatagaa 
tgatggatta 
ctctctggaa 
taatctggtg 
ttatagcaat 



atgaaaggag 
tattatggag 
aacatggata 
cgatattctg 
gttgacttca 
gaggggaaaa 
attagtgccg 
gattatccct 
ggcaaggcat 
ctgccatatg 
gaatccatag 
gctacgttta 
gatactctag 
atgtgtaatt 



agaatgtatt 
ctaatggatc 
aggttagcgc 
ccgtgtttaa 
ctgattgtcg 
tcaatccact 
tatactttaa 
tttacgtatc 
ttaatcacgc 
ttggagatac 
aacaaaatct 
tcgatgttca 
taaagtcagg 
cagatgtgag 



catttctcca 60 
cactgctgaa 120 
tcaaaatatc 180 
agattccttt 240 
cactatagat 300 
attggatgaa 360 
agcaaaatgg 420 
tccgacggaa 480 
atctgtaaag 540 
tagtatgatg 600 
aacagataca 660 
cattcccaag 720 
actgacagag 780 
tgtcgacgct 840 
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atgatccaca aaacgtatat agatgtcaat gaagagtata cagaagcagc tgcagcaact 900 

tgtgcactgg tgtcagactg tgcatcaaca attacaaatg agttctgtgt agatcatccg 960 

ttcatctatg tgattaggca tgttgatgga aaaattcttt tcgttggtag atattgctct 1020 

ccgacaacta attgttaa 1038 



10 



<210> 14 
<211> 453 
<212> DNA 

<213> Vaccinia virus 



15 



20 



<400> 14 

ttaatccatg 

gtagttctct 

atagtgtttg 

atacagatgt 

tttcaccgca 

atctgggcgt 

tttgcatccg 

aataatgatg 



gactcataat 
tctttaactt 
aagagctcgt 
attacagcct 
tagttgtttg 
ataatgaatc 
tagttatccc 
tcgaattcgt 



ctctatacgg 
tatacttttt 
tctcatcatc 
catatattac 
caaatacggt 
taaactttaa 
ctttatgtaa 
gctgtatacc 



gattaacgga 
actaatcata 
agaataaatc 
gtaatagaac 
taatcctttg 
tttcttgtaa 
ctgtaaattt 
cat 



tgttctatat 
tttagactga 
aatatctctg 
gtgtcatcta 
acctcgtcga 
tcattcgaaa 
ctcaacgcga 



acggggatga 
tgtatgggta 
tttttttgtt 
ccttattaac 
tttccgacca 
taatttttag 
tatctccatt 



60 

120 

180 

240 

300 

360 

420 

453 



<210> 15 
<211> 660 
25 <212> DNA 

<213> Vaccinia virus 



30 



35 



40 



<400> 15 

atggcgatgt 

ggaatatcat 

aacaagtatg 

tatattggag 

atccatgatc 

gctctaagcg 

catcacgtac 

atcaaagaga 

gtctggatag 

atgagaatga 

cttggggaga 



tttacgcaca 
cgactgttgc 
acattgtaaa 
cactgctgcc 
aagaaggaaa 
gaatcgggta 
ttgaaacagg 
aggccaaaga 
gagattgtat 
gattcaaaaa 
atgatacaga 



cgctctcggt 
caatgatgtc 
agacaaatat 
tatgtttgag 
tcaaatctct 
cgagagtcta 
aaacgctgta 
aatgagtaca 
ctgtcaagtt 
gggtgcggtg 
aaatctttct 



gggtacgacg 
aggaaatatt 
atgtggtgtt 
tgcaatgaat 
atcatcacat 
gacttgtgtt 
tatggaaaag 
cttagtccag 
actgctgtgg 
cttccgatcc 
tctactatat 



agaatcttca 
ctgttgtgtc 
acagtcaggt 
atctacaaat 
atcgccacaa 
tggaaggagt 
ttcaacatga 
gacctataat 
acgtacatgg 
caaatctggt 
cggcggcacc 



tgcctttcct 
agtttataat 
gaacaagaga 
tggagatccg 
aaactactat 
agggattcat 
ttattctact 
tgattaccac 
aaaggaaatt 
aaaagttaaa 
atcgaggtaa 



60 

120 

180 

240 

300 

360 

420 

480 

54 0 

600 

660 



45 



<210> 16 
<211> 957 
<212> DNA 

<213> Vaccinia virus 



50 



55 



60 



<400> 16 

atgacgaccg 

aattatccat 

gttaacaacg 

tcctcacaac 

agagtacaac 

ttattgatat 

aatgctgaag 

tccttgggag 

aatcttagaa 

atactatttg 

aattatgcaa 

gatgaaatag 

attatcgtca 

ctcggatttg 



taccagtgac 
ctaacaaaaa 
tggtagatag 
ttaatgaaga 
ctcatactac 
cggaacaacg 
caataatgga 
tagtttatga 
atcaacgatc 
gtaagactcc 
atttgaacgg 
atagaatcta 
ctaacgtgat 
aagaaatcaa 



ggatatacaa 
ttatgaaata 
agaacataat 
tctatttcca 
tattattgac 
tcaacaacga 
atctagatct 
taaagataaa 
taatacaaaa 
gtataaatca 
gtctccctta 
taaaacgatt 
tattattgtc 
aggactgagt 



aacgatttaa 
actcttcgtc 
gccgccgtag 
gatgatgatt 
gatactccac 
gaaaaaagat 
atgatatctt 
agaattcaga 
tcatctgata 
acagaagtta 
tcagtcgagg 
aaacaatatc 
ataaacatta 
accgatatca 



ttacagagtt 
aaatgtctat 
tgtcatctcc 
ctccggccac 
ctcctacgtt 
ttaatattac 
ctatgccaac 
tgttggagga 
atttagataa 
ataagcgtat 
acttggatgt 
acgaaagtag 
tcgagcaagc 
cttcagaaat 



ttcagaagat 
tctaactcac 
agaggaaata 
tattatcgaa 
tcgtagagag 
agtatcgaaa 
acaaacacca 
tgaagtggtt 
ttttaccaga 
agccatcgtt 
ttgttcagag 
aaaacgaaaa 
attgctaaaa 
tatcgatgtg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 
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gagatcggag atgactgcga tgctgtagca tctaaactag gaatcggtaa cagtccggtt 900 
cttaatattg tattgtttat actcaagata ttcgttaaac gaattaaaat tatttaa 957 



5 <210> 17 
<211> 273 
<212> DNA 

<213> Vaccinia virus 

10 <400> 17 

ttagttcatg gaaatatcgc tatgattggt 
gcagtgcttt ccccacatag aataaattag 
aaacgccata atactcaata ctttccatgt 
aataaaggcg aagatacacg aaagaatcaa 

15 aaaataattt ccaatcataa gcatcatgtc 



atgaatgact ccgctaactc tgtggggtgc 60 
cattccgact gtgataataa taccaagtat 120 
acgagtggga ctggtagact tactaaagtc 180 
aagaatgatt ccagcgatta gcacgccgga 24 0 
cat 273 



<210> 18 
<211> 3861 
20 <212> DNA 

<213> Vaccinia virus 

<400> 18 

atggctgtaa tctctaaggt tacgtatagt 

25 gatattatca ttagtcatgt taaaaatgac 
ctaggtgcta tggatggggc attatgtaag 
ggtcactggg gtaaagtaag tatttataaa 
gaaattattc gtttactgaa tcatatatgt 
ccgtattccg acgatattaa cctaaaagag 

30 gataaaatat tatccaagaa aaagtcatgt 
aaaattactt tttcaaagaa aaaggtttgt 
cctaattctc tcatctatca aaagttaatt 
gaaattcatc aatatccagc taacttattt 
attattagac cggctattag tttttggata 

35 acttacttat taggtatgat cgttaagaat 
cagaaggcgg taatagaata cgatgatatt 
aatttatcat atattacatc cggcaaaaat 
cgaaaagatc agaccgctag atctgtaatt 
gtaggaatgc ccgcatatat tagaaataca 

40 acagtggata aagttaaaca actattagcg 
cgattaaacc aattaacaag aatacgccaa 
ttgcctggtg attgggtaga agtagctgtt 
cagccgtctc tacatagata caacgtcatc 
actatcaaaa tatctcccgg aattgccaac 

45 gaatggatga tattggagca aaatcctaaa 
ccgacgacgt tactcaaaca cgatattcat 
gaaatcgtag cagcgtattc attgtttaga 
aacatcttgg ggaaatatgg aagaaagttc 
aaagatatct atacttactt gataggtgaa 

50 ggtgaaatta ttgcaaacga cgtagatagt 
ttggctggac tcttatccga tcataagtcg 
tcatcttatg tttttaagag atatctatct 
ctgagaccaa attcgacgtt cactaataaa 
cttatcaaag aagcatacgc caaatatctc 

55 ttatctaaag ctttagaggc ggactatgtg 
aatatccgag agatagaaga acatatgaga 
ctcctgaaaa tggccaaagc gggttataaa 
ggtacttatg gacaacagag gattgatggt 
gtcttacctt actatcttcc agactctaag 

60 tctttaacaa aaggattaac aggttctcaa 
caatctactg atatcgtctg tgaaacatca 



ctatatgatc aaaaagagat taatgctaca 60 
gacgatatcg gtaccgttaa agatggtaga 120 
acttgtggga aaacggaatt ggaatgtttc 180 
actcatatag ttaagcctga atttatttca 24 0 
attcactgcg gattattgcg ttcacgagaa 300 
ttatcgggac acgctcttag gagattaaag 360 
tggaacagcg aatgtatgca accgtatcaa 420 
ttcgtcaaca agttggatga tattaacgtt 480 
tctattcatg aaaagttttg gccattatta 540 
tatacagact actttcccat ccctccgctg 600 
gatagtatac ccaaagagac caatgaatta 660 
tgtaacttga atgctgatga acaggttatc 720 
aaaattattt ctaataacac ttccagtatc 780 
aatatgatta gaagttatat tgtcgcccga 840 
ggtcccagta catctatcac cgttaatgag 900 
cttacagaaa agatatttgt taatgccttt 960 
tcaaaccaag ttaaatttta ctttaataaa 1020 
ggaaagttta ttaaaaataa aatacattta 1080 
caagaatata caagtattat ttttggaaga 1140 
gcttcatcta tcagagctac cgaaggagat 1200 
tctcaaaatg ctgatttcga cggagatgaa 1260 
gccgtaattg aacaaagtat tcttatgtat 1320 
ggagcccccg tttatggatc tattcaagat 1380 
atacaagatc tttgtttaga tgaagtattg 144 0 
gatcctaaag gtaaatgtaa attcagcggt 1500 
aagattaatt atccgggtct cttaaaggat 1560 
aattttgttg tggctatgag gcatctgtca 1620 
aacgtggaag gtatcaactt tattatcaag 1680 
atttacggtt ttggggtgac attcaaagat 174 0 
ttggaggcca tcaacgtaga aaaaatagaa 1800 
aacgatgtaa gagacgggaa aatagttcca 1860 
gaatccatgt tatccaactt gacaaatctt 1920 
caaacgctga tagatgatcc agataataac 1980 
gtaaatccca cagaactaat gtatattcta 2040 
gaaccagcag agactcgagt attgggtaga 2100 
gatccagaag gaagaggtta tattcttaat 2160 
tattactttt cgatgctggt tgccagatct 2220 
cgtaccggaa cactggctag aaaaatcatt 2280 
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aaaaagatgg aggatatggt ggtcgacgga 
atcaagtacg ccgccaatta taccaaaatt 
atctatccag atgagtccat gacttggtat 
aaacagggat tcgtttactc tcagaaacag 
5 aatttcctag tattcgtcaa acccaccact 
tacgatatga ttcataacgt cattgatgat 
aatatagatt ttatggagta tatattcttg 
acaaaagaaa cggctatcac tatctttgaa 
ggtggtggaa ctcctattgg aattatttct 

10 caagccctgt ccagttttca cactactgaa 
ttcaacgagt ttaataacct gactaatttg 
gtatccgatg atatctctaa acttcaatct 
ggagaattaa atccaaacat cactcttcga 
atagtcaata gattatacat caagagagca 

15 attgaacgat ttatctcctt tagcgtcatt 
gaggacgagg ataatattag atttactgtc 
aatcttagta agtttatgat ggttcttccg 
ttcaagattc ctatctctga ctatacggga 
aataagatga ctgtagaact catgaatcta 

20 gtcaacgtgt atcctggagt atggaataca 
gaatacttgt gcgaagccat gttaaacacc 
ccttgtgatc ttctcgctag tttactatgt 
ttcaagttcg gcgcagctag tactcttaag 
ttaaacgcgg ctcttcataa aaagtcagaa 

25 tttagcaagg tccctaatat aggaactgga 
ctcatgagaa tggaaaggaa actatctgat 
gaagaaacag aagactttta a 



tacggacaag tagttatagg taatacgctc 2340 
ctaggctcag tatgtaaacc tgtagatctt 2400 
ttggaaatta gtgctctgtg gaataaaata 2460 
aaacttgcaa aaaagacatt ggcgccgttt 2520 
gaggataatg ctattaaggt taaggatctg 2580 
gtgagagaga aatacttctt tacggtatct 264 0 
acgcatctta atccttctag aattagaatt 2700 
aagttctatg aaaaactcaa ttatactcta 2760 
gcacaggtat tgtctgagaa gtttacacaa 2820 
aaaagtggtg ccgtcaaaca aaaacttggt 2880 
agtaagaata agaccgaaat tatcactctg 2940 
gttaagatta atttcgaatt tgtatgtttg 3000 
aaagaaacag ataggtatgt agtagatata 3060 
gaaattaccg aattagtcgt cgaatatatg 3120 
gtaaaggaat ggggtatgga gacattcatt 3180 
tacctaaatt tcgttgaacc ggaagaattg 3240 
ggtgccgcca acaagggcaa gattagtaaa 3300 
tatgacgact tcaatcaaac aaaaaagctc 3360 
aaagaattgg gttctttcga tttggaaaac 3420 
tacgatatct tcggtatcga ggccgctcgt 34 80 
tatggagaag ggttcgatta tctgtatcag 3540 
gctagttacg aaccagaatc agtgaataaa 3600 
agagctacgt tcggagacaa taaagcattg 3660 
cctattaacg ataatagtag ctgccacttt 3720 
tattacaaat actttatcga cttgggtctt 3780 
aagatatctt ctcaaaagat caaggaaatg 3840 

3861 



30 



35 



40 



45 



50 



55 



60 



<210> 19 
<211> 2001 
<212> DNA 

<213> Vaccinia virus 



<400> 19 

ttaacgagtt 

caaataagaa 

attaacttta 

ggatacaaaa 

agctataata 

taacacagac 

cgtcttctcg 

attatttagt 

tcgttgaccg 

tagcctatcc 

atagaagagc 

tgtaagatac 

ggtatctgtt 

tttgacaatt 

tctgacaaca 

taccttgcta 

atcctttttg 

accagattgc 

ggcaaattgt 

gtccaatgtt 

aattttatat 

tccatcgtac 

gggactatat 

aactagtttt 

tatattatat 

atatagatgt 



ccatttatat 
ggtacggtac 
atgtatgaaa 
tgtttgacat 
tattctatga 
atggtatcaa 
atggagtgtc 
tttttctttt 
attaagtttt 
aataatccat 
gacagacatc 
ttgaagacat 
accataattc 
tttagcacca 
cagggattaa 
ttttttctgg 
atgatagtgg 
atggtgattt 
ctatatctaa 
agagtatcta 
tcctctatta 
atggttggaa 
ctaacatctt 
atacacatct 
tcatcagata 
agtgtagctc 



catccaatat 
ctttgtccac 
acagtacgcc 
tagtataatt 
tggtattgaa 
cagatagctt 
cgtataccaa 
tattctcgtt 
gattgatttt 
catctgtgcg 
tggaacaatt 
tcctatgatg 
ctttgatggc 
ttatctttgt 
gacggaaaga 
cattatctat 
atctcaatga 
gtcttctttc 
aatcataata 
catcagtttt 
agtcctcgtc 
gatgcttgtt 
gattaataaa 
cttcatcggt 
tacgaagaac 
ctacaggaat 



tattgaaatg 
catctcctcc 
acatgcttcc 
gtttaagact 
gaagatgaca 
gaatgaaaga 
catgtctgat 
aaacagcatt 
tccgtgtaag 
tagatcacat 
acagacagca 
atgcagaatt 
tgatagtgtc 
tttgatatct 
tgaaatgatt 
atgtgcgaga 
catgggacgt 
ttttatcata 
tgagatgttt 
gtattccaaa 
gataataaca 
gacaaaatct 
atttataaca 
aagtttagac 
aatgtccaaa 
atctttaact 



acgttgatgg 
aattcatgct 
atgacagtgt 
gtcaatctat 
atcttggcat 
gaatcagtaa 
attttgatgt 
tctgtcaacg 
gcgtatctag 
cgtacacttt 
atttctttat 
ttggataaca 
agagcacaag 
atatcagaca 
ctctcaacat 
atatcctcta 
ctaaaccttc 
atgtaatctc 
acctctacaa 
ttaaacatgg 
gaatgtagat 
ttaattgtct 
ttgtccatag 
agaatatcgt 
tctatattgt 
aagtcaatga 



acagatgata 
ctattttgtc 
gtaacacttt 
aatagatagt 
attgatcatt 
ttggaataag 
attccattaa 
gaccccaaca 
tcagatcgta 
ttaattctct 
tctctacaga 
cggtattgat 
atttccaatc 
gcatggtgcg 
cttcaatgga 
gagaatcagt 
ttattctatc 
taaattcatc 
atatctgttc 
caacggattt 
aatcatttaa 
tgatgaaggt 
gatactttgt 
gaacaggtgg 
ttaatatatt 
tttcatcaac 



60 

120 

180 

240 

300 

360 . 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 
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10 



15 



20 



25 



30 



35 



40 



cgttagatct 
gactacattc 
cataagcttg 
agcttttagg 
gtttattatt 
atacagtgat 
gctagacacc 
aaattccgga 



attttaaagt 
tcattaatta 
actacatttg 
tactcatcta 
tcaggaggaa 
tttggcaata 
ttttcaatgt 
tacatgaaca 



taatcatata 
accattccaa 
gtcccgatac 
ctctacaaga 
aaaacctaac 
gtccgtgtaa 
ttaatttttt 
t 



ggcattgatt 
gtcaetgtgt 
cattaaagaa 
attttggaga 
attgagaatg 
tccataatcc 
tgaaataagc 



tttaaaaggt 
gtaagaagat 
ttcttatgat 
gccttaacga 
tcggagttaa 
agtaacacga 
tttgataaag 



atgtagcett 
tatattctat 
ataaggaaae 
tatcagtgac 
tagcttccag 
gctggtgctt 
ccttcctcgc 



1620 
1680 
1740 
1800 
1860 
1920 
1980 
2001 



<210> 20 
<211> 1539 
<212> DNA 

<213> Vaccinia virus 
<400> 20 

ctattgtaga aattgttttt cacagttgct caaaaacgat ggcagtgact tatgagttac 60 
gttacacttt ggagtctcat ctttagtaaa catatcataa tattcgatat tacgagttga 120 
catatcgaac aaattccaag tatttgattt tggataatat tcgtattttg catctgctat 180 
aattaagata taatcaccgc aagaacacac gaacatcttt cctacatggt taaagtacat 24 0 
gtacaattct atccatttgt cttccttaac tatatatttg tatagataat tacgagtctc 300 
gtgagtaatt ccagtaatta catagatgtc gccgtcgtac tctacagcat aaactatact 360 
atgatgtcta ggcatgggag acttttttat ccaacgattt ttagtgaaac attccacatc 420 
gtttaatact acatattttt catacgtggt ataaactcca cccattacat atatatcatc 480 
gtttacgaat accgacgcgc ctgaatatct aggagtaatt aagtttggaa gtcttatcca 54 0 
tttcgaagtg ccgtgtttca aatattctgc cacacccgtt gaaatagaaa attctaatcc 600 
tcctattaca tataactttc catcgttaac acaagtacta acttctgatt ttaacgacga 660 
catattagta accgttttcc attttttcgt ttcaagatct acccgcgata cggaataaac 720 
atgtctattg ttaatcatgc cgccaataat gtatagacaa ttatgtaaaa catttgcatt 780 
atagaattgt ctatctgtat taccgactat cgtccaatat tctgtcctag gagagtaatg 84 0 
ggttattgtg gatatataat cagagttttt aatgactact atattatgtt ttataccatt 900 
tcgtgtcact ggctttgtag atttggatat agttaatccc aacaatgata tagcattgcg 960 
catagtatta gtcataaact tgggatgtaa aatgttgatg atatctacat cgtttggatt 1020 
tttatgtatc cactttaata atatcatagc tgtaacatcc tcatgattta cgttaacgtc 1080 
ttcgtgggat aagatagttg tcagttcatc ctttgataat tttccaaatt ctggatcgga 114 0 
tgtcaccgca gtaatattgt tgattatttc tgacatcgac gcattatata gttttttaat 1200 
tccatatctt ttagaaaagt taaacatcct tatacaattt gtggaattaa tattatgaat 12 60 
catagttttt acacatagat ctactacagg cggaacatca attattacgg cagcaactag 1320 
tatcatttct acattgttta tggtgatgtt tatcttcttc cagcgcatat agtctaatag 1380 
cgattcaaac gcgtgatagt ttataccatt caatataatc gcttcatcct ttagatggtg 1440 
atcctgaatg cgtttaaaaa aattatacgg agacgccgta ataatttcct tattcacttg 1500 
tataatttcc ccattgatag aaaatatcac gctttccat 1539 



45 <210> 21 

<211> 2358 
<212> DNA 

<213> Vaccinia virus 

50 <400> 21 

atggatgcgg ctattagagg taatgatgtt 

tcagcatgta gacaaaatga agatccaaga 

aaaagatata ttgataataa tccagaatgt 

gcatactcta tagtcagaat tttcatggat 

55 gattatttaa cggctattca agattttatt 

gcgtttacag aatgcggtgc cattcatgaa 

tcattgacta agtctacaaa tagagataaa 

tataccacta tggatacatt gatagctatg 

tctgaaaatc cactaacaag atcgatagac 

60 cgggttgtag gtactaggaa aaatccaaat 

catgataata tagaagatta cctattcact 



atctttgtcc ttaagactat aggtgtccca 60 
ttcgtagaag catttaaatg cgacgagtta 120 
acactattcg aaagtcttag ggatgaggaa 180 
gtagatttag acgcgtgtct agacgaaata 240 
atcgaggtgt caaactgtgt agctagattc 300 
aatgtaataa aatccatgag atctaatttt 360 
acaagttttc atattatctt tttagacacg 420 
aaacgaacac tattagaatt aagtagatca 480 
actgccgtat ataggagaaa aacaactctt 54 0 
tgcgacacta ttcatgtaat gcaaccaccg 600 
tacgtggata tgaacaacaa tagttattac 660 
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15 



20 



25 



30 



ttttctctac 
atttcattcg 
tttaatgatc 
ccttgtgcat 
ggtgctatta 
ttggatggta 
ttaaccgaac 
gaacccttga 
agcgaattac 
gtagattcag 
gacctggtag 
tcaaccggat 
ttaatgaata 
ctatatgaaa 
ttttttggag 
ggtgacctgt 
aatccattta 
tttgcctgta 
tgtgtcattg 
attatcgata 
attgccgtcg 
aataatgacg 
aataatagat 
gttcctatta 
aaaataggta 
tccaaaaagg 
cagaaaatat 
aatagacata 
gatatttcat 



aacgacgatt 
aagacgctat 
tcgatgaaaa 
tatgtaaaaa 
gaatttacaa 
ataaactgtt 
gaggagacta 
taacaaaact 
tctgtccgag 
tagagaccga 
acggaatgtt 
ttaaatttga 
tcattaacga 
aaacattatc 
aaactgcaac 
ttgttgagac 
tcgctaacat 
gtggatcaaa 
gaagaccgtg 
ctaattacaa 
tgcgattcag 
cgtacgataa 
atagatttgc 
tgaaactata 
ctctgttagt 
gatatatatt 
ccaagtattt 
agaaatttgc 
ctccgtaa 



ggaggattta 
aaaaagagtt 
taattttaca 
acgatcgcat 
aactggtaat 
taatattgca 
tatagtttgg 
aattctgtca 
gaaacgaaag 
tacctatccg 
ttactctgga 
cgatacaaag 
tatccaacca 
tagttgttta 
tggaaagtcg 
gggtcaaaca 
gcatttgaaa 
gaaaattaga 
tttctccaat 
acctgtcttt 
aacacacttt 
agtcaaacta 
atttctatac 
tcctacaccc 
atctagctct 
gtacgataat 
taattctaga 
caatgttagt 



gttcctgata 
tcaaaaatat 
acggtaccac 
aaacatccgc 
ccacatagtt 
caaagaattt 
attaataatt 
ataagacatc 
actgtagaag 
gataaacttc 
gatgatgcta 
ttcgtcgaag 
ttaacggatg 
tgtggtgcta 
acaaccaaac 
attttaacag 
agatctgtat 
tctgataata 
aaaattaata 
gataggatag 
tctcaacctt 
ttagacgagg 
ttgttggtga 
gaagagattc 
gtaaagcata 
gtggttactc 
ctatttggac 
gatgaatatc 



agttatggga 
tcattaattc 
tggtcataga 
atcaactatc 
gtaaagttaa 
tagacactaa 
catggaaatt 
aactacctaa 
ctaacatacg 
cgtttaaaaa 
aaaaatatac 
acagtccaga 
aaaataagaa 
ccaaaggatg 
gtttgttaaa 
atgtattgga 
tctgtagcga 
ttaaaaagtt 
atagaaacca 
ataacgcatt 
ctggtagaga 
ggttagatgg 
aatggtacaa 
ctgactttgc 
ttccattaat 
ttccgttgac 
acgatataga 
tgcaatatat 



accagggttt 
tataataaac 
ttacgtaaca 
gttggaaaat 
aattgttccg 
ctctgtttta 
taacagcgaa 
ggaatattca 
agacatgtta 
tggtgtattg 
gtgtactgta 
aatggaagag 
aaatagagag 
tttaacattc 
gtctgctatc 
taaaggacct 
actacctgat 
gacagaacct 
tgctacaatc 
aatgagaaga 
ggctgctgaa 
taaaatacaa 
aaaatatcat 
attctatctc 
gacggacctc 
tactttccaa 
gagcttcatc 
attcatagag 



720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2358 



35 



<210> 22 
<211> 612 
<212> DNA 

<213> Vaccinia virus 



40 



45 



<400> 22 

ttaataatcg 

cgcagtataa 

atagtcctgt 

agaaataata 

agctacaata 

agttactaag 

tatcatcaat 

gagtaacgtt 

atcgttttgc 

taaatcttta 

taaataactc 



tcagtattta 
ggtttgttgc 
ctttcgatgt 
ttaaatatct 
cacacaatag 
caataggtaa 
atagagatta 
ctaacatcat 
atcatacctc 
tcaagcactc 
at 



aactgttaaa 
aggtatactg 
tcatcacata 
gtgaattcgt 
acattcccac 
taactaagct 
gaggagggct 
tatttttgaa 
catctttagg 
cagcacccgc 



tgttggtata 
ttcaggaatg 
tgcaaagaac 
aaatacattg 
agtgttgcca 
agtaagaggc 
atatagagcc 
gattcccaaa 
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